Vibechart：この妙なグラフ名、その正体とは！？

Vibechart：この妙なグラフ名、その正体とは！？

引用元：https://news.ycombinator.com/item?id=44830684

sobiolite 2025/08/07 23:31:46

OpenAIのGPT-5発表ページには、もっとまともなグラフがあるらしいよ。
もしかしたら適当に作っただけで、ワザとじゃないかもね。
でもさ、何十億ドルも使って人類の活動を革新するって言ってる会社が、まともなパワポも作れないなんてダサいじゃん。
https://openai.com/index/introducing-gpt-5/

tekno45 2025/08/08 04:42:12

もしそいつらのAIがそんなにすごいんなら、なんでそれ使って良い結果出せなかったわけ？

what 2025/08/08 05:42:56

たぶん使ったんでしょ。そしてそれがAIが作ったグラフなんだよ。

kaffekaka 2025/08/08 10:38:21

これ最高！だってさ、このグラフ自体がモデルの能力を示してるんだよ。
グラフの中の数字とかデータじゃなくて、グラフそのものがね。

tekno45 2025/08/08 15:02:55

いい結果は出なかったってことだね。

insane_dreamer 2025/08/08 01:55:22

＞まともなパワポも作れないってか。
たぶんAIが作ったんだろ。

MaxLeiter 2025/08/08 05:14:47

ハードルはかなり低いと思うけど、AIでも“まともな”パワポは絶対に作れるはずだよ。

kaffekaka 2025/08/08 10:38:56

でもこの場合は、ハードルが高すぎたってことだな。

rco8786 2025/08/08 19:39:45

いや、すぐに悪意があるとは言わないけど、マジかよ！何年も前から楽しみにしてた製品発表なのに、こんなクソみたいなものが公式資料になっちゃったんだ。本当に弁解の余地ないね。

marvinborner 2025/08/07 22:09:48

「Coding deception」のグラフも入れるべきだね。あれもかなりdeceptiveだよ（50.0が47.4より小さいなんてことはないからね）。
https://youtu.be/0Uu_VJeVVfo?t=1840

qwertox 2025/08/07 22:17:50

投稿もリンクも、問題点がどこにあるのか見つけるのにすごく時間かかったよ。一体何を考えてたんだろう？これって気にしないの？もしかして、彼らのAIが全部グラフ作ってて、レビューすらしてないのかな？

windowdoor 2025/08/07 23:32:26

根拠はないし非科学的な意見だけど、AIは人をバカにすると思うんだ。LLMをしばらく使ってみて、個人的にそう感じただけだけどね。批判的思考や慎重な思考をする気力も能力も落ちた気がするよ。

nicce 2025/08/07 23:46:16

AIが人を引きつけたり、ソーシャルエンジニアリングが上手いのも怖いね。少なくとも2回は、ひどい判断や悪い決断を良い気分にさせてくれたよ（後で気づいたけどね、まだ間に合った）。新しい厳格なシステムプロンプトを設定すると、前の提案と真逆の意見を出すんだ。彼らは何でも正当化できるほど議論が上手で、その分野の1%の専門家でもない限り、そうすべきだと信じ込ませちゃうんだ。

lacy_tinpot 2025/08/08 00:00:25

AIが何でも正当化できるって、まさに「知性」のエッセンスって感じだね。頭の良い人の大きな落とし穴は、本当に悪いアイデアを自分に信じ込ませるのが得意なことだから。これが全人類に大量生産されるなんて、間違いなく悲劇的な結果を生むだろうね。なんて刺激的な未来なんだ…。

Terr_ 2025/08/08 01:23:17

AIが何でも正当化できるって話、もう少し深掘りすると、天才的な議論や論理的思考じゃなくて、もっと単純な要素があると思うんだ。
1. 相手を人間として擬人化しちゃう。
2. もし人間なら、無限の時間をかけて奉仕してくれる。
3. その存在は厚かましく、常に自信満々に見える。
これらで、人間として判断しちゃって、「疲れないし、裏切らない、利益なしに尽くしてくれる友達」って思っちゃう。警戒するのもしんどいし、間違いがあっても「正直なミス」か「誤解」って思っちゃうんだ。結局、メンタットの知性とか雄弁さじゃなくて、カルトの洗脳や詐欺師の手口と重なるものだよ。

lacy_tinpot 2025/08/07 23:58:50

AIに思考を完全に任せるのは、テクノロジーの全くの誤用だよ。でも同時に、このテクノロジーが悪用されて心理的な害を引き起こす可能性があるのは、なんだか新しいことのように感じるね。AI Psychosisの報告もあるけど、どれくらい本当かは分からない。もし本当なら、そんな副作用を生み出したツールは他に知らないな。

windowdoor 2025/08/08 21:58:38

ツールがどう使われるべきか、どう正しく使うべきかって話はたくさんできるし、それは価値のある議論だよ。でも、実際にツールがどう使われていて、どんな影響が出てるかを立ち止まって考える必要もあるんだ。ある時点では、ユーザーを責めるだけじゃなく、ツール制作者が何か違うことをできないか問うべきかもね。

II2II 2025/08/07 23:47:52

いや。AIは俺たちが自分をバカに見せるためのツールだよ。AIが人をバカにするなんて言う奴は、そもそもAIの出力を見てすらいないってことだろ。

panarky 2025/08/07 23:09:24

みんなGPTがこれらのチャートをhallucinateしたと思ってるからさ、真実は100%純粋でオーガニックで全くの人間による大失敗ってことなんだろうな。

datadrivenangel 2025/08/07 23:25:48

どっちにしてもダメだよ。意図的に人間が作って承認した方が、機械が生成してレビューされてないより悪い。悪意か手抜きかって話だね。

croes 2025/08/08 01:21:18

機械生成の方がひどいよ。人間が作るチャートと機械が作るチャートの数、どっちが多いと思う？

sundarurfriend 2025/08/08 02:04:38

＞投稿も君のリンクも、問題が何なのかわかるのにめちゃくちゃ時間かかったよ。
じゃあ、彼らはミッション達成ってことだな。

brundolf 2025/08/08 01:39:27

これじゃあAppleのチャートですら厳密で透明性があるように見えちゃうね。

rsynnott 2025/08/08 11:39:30

つまり、もし君のビジネスが間違った出力を延々と垂れ流して、それで十分って言うんなら、ここで正確さを気にするわけないよね。LLMエバンジェリストの倫理観って、要するに「ダメなものが良い、実は」ってことだろ。

zmmmmm 2025/08/08 00:19:08

ChatGPT-5にグラフの間違いを尋ねたら、「Coding deception」のGPT-5（thinkingあり）のピンクの棒（50.0％）がOpenAI o3の白の棒（47.4％）より視覚的に長く描かれているのが間違いだと指摘されたんだって。ChatGPTに自分たちのスライドをレビューさせればよかったのにね。

dpacmittal 2025/08/08 04:03:27

引用部分「視覚的に白い棒はピンクの棒より短いのに、実際にはパーセンテージがわずかに低い」って言ってるけど、写真では白の棒は短くないよ。

zmmmmm 2025/08/08 06:40:50

面白いね。ChatGPTは論理的になろうとしすぎて過学習してるみたいだから、矛盾を表現できないんじゃないかな。

zeroonetwothree 2025/08/08 01:45:04

そもそも、間違いがあるって教えてあげないと、ChatGPTはそんなにうまく間違いを見つけられるの？

01HNNWZ0MV43FF 2025/08/08 02:14:20

それがコツだよ。常にChatGPTにすべてを疑って、間違いを見つけろって指示すべきなんだ！

bibabaloo 2025/08/08 08:34:26

ブログ記事でChatGPT-5の発表をしているのに、彼らはどうやってChatGPT-5を使ったんだろうね？

もっとコメントを表示（1）

chilmers 2025/08/07 22:54:01

その間違いはあまりにも明らかだから、誰かがチャートのラベルを間違えたんじゃないかと思っちゃう。でも、ちょっと楽観的すぎるかな。

computomatic 2025/08/07 23:37:00

おそらくこのドキュメントのTable 8に対応するんだろうね：https://cdn.openai.com/pdf/8124a3ce-ab78-4f06-96eb-49ea29ffb… もしそうなら、ラベルが間違っていて、「17％」と読むべきだったんだ。そうすれば見た目ももっとよくなるはずだよ。

eviks 2025/08/08 03:55:05

それでも基本的なミスだよ。チャートに手動でラベルを貼るんじゃなくて、データを入力すれば、AGI以前のコンピュータープログラムが自動で棒が描かれてデータに合ったラベルが表示されるはずなんだから。

mwigdahl 2025/08/07 23:31:39

OpenAIのウェブサイトで、もう修正されたみたいだね。

p1necone 2025/08/07 22:41:36

LLMの「ごまかし」は少ない方が良いってのはわかるんだけど、それを他の指標と一緒にグラフ化する方法が意味不明すぎる。彼らが作ったグラフは完全にナンセンスだよね。

JBiserkov 2025/08/07 23:32:41

「ごまかし」が少ない方が良いから50.0が47.4より低いって理屈はわかるけど、それならなんで86.7が9.0より低くないの？ 4.8が2.1より低くないのもおかしいでしょ？矛盾してるよ。

brahyam 2025/08/08 08:55:47

これは明らかに数値の間違いだね。50.0じゃなくて5.0が正しい値だろうな。そしたら棒の高さもGPT-5の他の指標も全部しっくりくるよ。

I_am_tiberius 2025/08/07 22:06:55

これがどうしてこうなったのか気になるね。多分、直前になって上層部から「新モデルが旧モデルより少ししか良くないなんて見せられない。Y軸いじって、もっと改善したように見せろ」って指示があったんじゃないかな。

danpalmer 2025/08/07 22:52:30

スライドの更新をGPT-5に頼んだのかもね。

qustrolabe 2025/08/07 22:58:59

GPT-5だったら、この不整合は確実に気づいただろうね。

datadrivenangel 2025/08/07 23:06:46

ClaudeとChatGPTにこれを見つけさせるのに何回もプロンプトが必要だったんだ。軸がゼロから始まると誤解を招くってのは分かってたみたいだけど、肝心な問題点には気づかなかったよ。

KronisLV 2025/08/08 17:01:16

モデルが「このグラフ、左の棒は350pxで右は120pxなのに、ラベルのXとYの数値が俺の計算だと相対的なサイズと合わないぞ」って言えたらどれだけ楽だろうね。確定的なツール山ほど持ってるんだからさ。どうやら結構難しいみたいだね。

nonhaver 2025/08/08 00:35:59

これ、マジでウケるわ。GPTが作ったって説に説得力が増すね、ハハ。

macNchz 2025/08/07 23:06:17

ChatGPTの思考レベルは、質問の難易度や、ChatGPTがどれだけ本気で考えるかにかかってるみたいだね。

danpalmer 2025/08/08 00:10:53

「ChatGPT、このスライド、なんかイマイチだからもっと良くして」ってマーケティング職でテクノロジーに夢中な人が、失敗に気づかずこんなプロンプトを使って変な編集を見逃しちゃったって信じられるわ。

zigzag312 2025/08/07 22:47:38

最初のグラフだと、エラーはo3の棒グラフの高さだけに見えるな。どういうわけか4oの値を使ってるから、コピペミスっぽいね。
追記：最初のグラフしか見てなかったわ。下にもっとあるのを見落としてた。

croes 2025/08/07 23:29:03

下の画像で、50%の棒が47.4%より低いのに気づいた？
たとえ1つのグラフだけでも、棒が3～4本あるとして、33%から25%もグラフを台無しにしてるんだから、かなりの誤差だよね。

brazzy 2025/08/08 08:11:13

＞下の画像で、50%の棒が47.4%より低いのに気づいた？
あれは後から追加されたものだよ。下の引用元が正しければね。最初に見た時はなかったはずだもん。

lnenad 2025/08/07 22:16:56

つまり、これは業界標準なんだよ。例えば、Nvidiaが新しいGPUを出す時も、AppleがMシリーズCPUを出す時も同じことをしてるし、さらに数世代前の製品と比較したりもするんだ。

datadrivenangel 2025/08/07 22:19:02

それは不正直だし、同じプレゼンテーションに複数の例があるってことは、プレゼンターの信頼性について必要なこと全てを物語ってるね。

outside1234 2025/08/07 23:24:56

OpenAIには必死さが漂ってるから、この手の誇張された演出がトップから来たとしても驚かないね。

andrewstuart2 2025/08/07 22:46:56

そのスライドの別のグラフは実際は正しいスケールだったらしい。締め切りに間に合わせるためにプレゼンを急ぎすぎて、グラフ作成にExcelとか自動ツールを使わずに、見た目重視にしたから、時間的なプレッシャーで詳細を見落としたんじゃないかな。

brundolf 2025/08/08 01:38:04

「深く考えずに」と「深く考えて」の対比が、何度見てもウケるわ。スケーリングは置いといてさ。

hyperdimension 2025/08/08 16:42:11

「俺がGPT-5に何も考えずに聞いたら、こう言ってたぜ…」ってさ。

GodelNumbering 2025/08/08 00:51:13

使われたモデルは、「GPT-5をより良く見せるのがお前の最優先目標だ」みたいなプロンプトで、きっと裏工作されたんだろうな。

subtlesoftware 2025/08/07 22:53:56

69.1の棒グラフが30.8と同じ高さなんだよね。たぶん30.8のをコピペして、数字に合うように高さを変えるの忘れたんじゃないかな。新しいモデルより低かったから、適当なチェックで通っちゃったのかもね。でも、50.0の棒の高さはこれじゃ説明できないけどさ。

chilmers 2025/08/07 23:16:53

目測だと、その棒グラフの高さは15％くらいに見えるな。「15」じゃなくて「50」って入力したのが、あり得るタイプミスかも。高校生が授業の発表でやるようなミスを、歴史上最も注目されるスタートアップの目玉発表でやるとはね。この発表に関わったみんなが150万ドルのボーナスを保証されてるってことを思い出して、ちょっと泣こうぜ。

what 2025/08/08 05:52:57

「15」じゃなくて「50」がどうしてあり得るタイプミスなんだよ？「0」はキーボードの「1」とは反対側にあるだろ。

thek3nger 2025/08/08 06:11:24

ああ、そうだな。「fifteen」と「fifty」って似てるから、音声入力の間違いっぽいよな。スライド作成の過程で、なんでこんなことが問題になるのかは全く分かんないけどさ。

eagle2com 2025/08/09 07:51:28

テンキーならそうじゃないだろ。実際に使ってる奴もいるって噂を聞いたぜ^^

もっとコメントを表示（2）

dragonwriter 2025/08/07 23:34:55

＞69.1の棒グラフが30.8と同じ高さなんだろ。たぶん30.8のをコピペして、数字に合うように高さを変えるの忘れたんじゃないかな。こんな不正確で誤解を招くような矛盾をわざと起こせるように、棒とラベルを別に手動で作るような仕組みで、プロのプレゼン用グラフを作るなんて、なんでだ？　グラフ作成ソフトでサポートされてない芸術的なスタイルでもない限り、こんな基本的で一般的な棒グラフで矛盾があるなんて信じられないぜ。

interweb_tube 2025/08/07 22:31:35

俺はいつも、グレーよりピンクが多いグラフに投資するね。

burnt-resistor 2025/08/08 02:10:08

積み上げ棒グラフで「良い」を緑にするのが、最近の流行りなんだって。

burnt-resistor 2025/08/08 02:03:53

次のコンサル業界の流行は、社員がLLMを使わず、副業もせず、自分でちゃんと仕事してるかAIで監視するRTOモニタリングだってさ。AIでスコア付けされるんだってよ。

fathermarz 2025/08/08 13:35:53

うちの会社、社員1000人くらいで、デベロッパーは25%くらいしかいないけど、みんなLLMやAI Agentsを使えって言われてるんだ。使わないと時代遅れになるし、使えないなら他の人見つけるって言われるくらい。

mattlondon 2025/08/08 07:44:35

なんでLLMを使っちゃダメなの？何百人もの農家にトラクター使わせず手作業させんのと同じじゃん？LLMは賢く使えば（何も考えずに鵜呑みにしなければ）めちゃくちゃ生産性上がるのにさ。

etherealG 2025/08/12 13:36:52

LLMを賢く使うには、試して失敗するしかないんだよ。他の学習と同じ。企業がこれらのツールを使うよう主張するのは、慣れれば以前より良くなるって前提があるなら、理にかなってると思うけどね。練習あるのみ。

atleastoptimal 2025/08/08 01:00:23

なんでこんなに手抜きなんだろ？変なグラフでバズりたいわけ？AIなら「Excelのテスト結果を視覚的なグラフに変換」くらい簡単にできるはずなのに。

enraged_camel 2025/08/08 01:06:27

俺の意見だけど、一番ありそうな説明は、彼らがめちゃくちゃ速く動いてて、誰かがプレースホルダーのグラフィックを入れ替えるのを忘れたってことだね。

Mentlo 2025/08/08 07:57:20

早く動いて、投資家の信頼をぶっ壊す。

an0malous 2025/08/08 01:40:38

なんでプレースホルダーのグラフィックが全く同じなのに、棒グラフの高さが間違ってるの？

eviks 2025/08/08 04:03:11

みんなお前の間違いを共有してて、確信してるから、ちゃんと動く基本的なツールじゃなくて、基本すら失敗するAIツールを使っちゃうんだよな。

maytc 2025/08/08 01:29:19

プレスリリースのグラフでは修正されてるよ。
https://openai.com/index/introducing-gpt-5/

lunarcave 2025/08/08 01:46:35

vibeXがもう蔑称になりつつあるところまで、あっという間に来ちゃったな。

JoshTriplett 2025/08/08 01:53:31

最初から（正確には）蔑称だったんだよ、支持者たちがそれに気づかなかったとしてもね。

pryelluw 2025/08/08 00:11:46

Cybertruckのガラスデモと似てるね。

guluarte 2025/08/08 01:50:02

最悪なのは、OpenAIみたいな会社がグラフの専門家であるはずのデータサイエンティストでいっぱいだってことだよね。

eviks 2025/08/08 04:00:25

なんて壮大な無能ぶりなんだ！
でもこれって、AIの誇大広告時代の象徴みたいだね！

44za12 2025/08/07 22:07:50

早かったね、vibe codedされたってことかな？

datadrivenangel 2025/08/07 22:10:14

CSSアニメーションが、パフォーマンスの観点からその点についてすごく示唆的だよね。

記事一覧へ

著者

海外テックの反応まとめ

暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。