OpenAI、o3価格を80%値下げ！

OpenAI、o3価格を80%値下げ！

引用元：https://news.ycombinator.com/item?id=44239359

34679 2025/06/10 23:41:35

OpenAIのo3使うためにAPIキー買ったんだけど、組織認証で生体認証とか求められてビビったわ。
20ドル返してくれ！
OpenRouterも試したけどAPIキー必要だったよ。
認証めんどくさすぎ！
https://openrouter.ai/settings/integrations
https://platform.openai.com/settings/organization/general

leetrout 2025/06/11 00:30:02

別のAI会社に返金されなくてカリフォルニア州のAGに連絡したら返金されたよ。
金払わせといて後から要件追加するのやめさせたいね。
あと、なんでみんな電話番号取られてんの？
名前と住所とクレカ情報あるのに必要なくない？

jazzyjackson 2025/06/11 02:10:44

（中の人じゃないけど）電話番号はマーケティングDBとかで投票履歴とか収入とか色々紐付けられて、ヤバい個人情報へのポインターになる可能性があるよ。
Twitterは電話番号を広告に使って1.5億ドル罰金食らってるんだ。
https://www.mediapost.com/publications/article/405501/None

azinman2 2025/06/11 05:20:47

OpenAIは広告売ってないよね。
APIユーザーだけに広告出すなんてありえないと思うな。
電話番号取るのは詐欺とか悪用を防ぐためでしょ？
ChatGPT使うのに電話番号いらないし。

conradev 2025/06/11 00:11:51

KYC必要なほどパワフルなモデル（ゼロデイ見つけたらしい）があるってプロセスにワクワクしたわ！使ってみて納得！

ddtaylor 2025/06/11 04:22:47

OpenAIはAPIクレジット期限切れにするからOpenRouter使ってるんだ。
10ドルだけだけど、もうOpenAIには1円も払わないって決めたね。

numlocked 2025/06/11 14:02:10

（OpenRouterのCOOです）うちでは実際にはクレジット期限切れさせてないよ。
でも、ずっと責任負うわけにいかないから、権利は持っておかないとね。
利益のためじゃなくて、運営上の保護なんだ。
クレジット発行する場所はどこも期限設定が必要なんだよ。

cess11 2025/06/11 05:20:50

Personaのデータ収集ってEUだとヤバくない？
超攻撃的なデータポンプに見えるんだけど。
https://withpersona.com/legal/privacy-policy

pembrook 2025/06/11 14:02:50

（大規模な詐欺対策経験者だけど）無料サービスで悪用を止めるには電話番号が一番確実なんだよ。
VOIP番号とかブロックして、ちゃんと契約してるか確認できるからね。
Facebookもそうしてる。
「データ売られる！」みたいな陰謀論じゃなくて、これが本当の理由だよ。
メールだけで登録できたらいいんだけどね。

_joel 2025/06/11 08:16:02

今どきの顔認証はビデオだよ。俺の経験では全部そうだったな。

__float 2025/06/11 01:09:19

多分、OpenAIは偽アカウントとかタダ乗りしようとする奴らを警戒してるんだろうな。

wqaatwt 2025/06/11 05:51:58

Hetznerみたいに色々データ要求する話もあるから違うかもな。単なるマネロン対策かも。クレカ会社が全額返金する羽目になったら特にね。

gloosx 2025/06/11 08:30:27

まだ人間は関わってないんだろ。検証は自動で確率的って言ってるしな—検証なのに笑える。ネットで見つかるパスポート持った人の写真ビデオ見せれば、子供でも回避できると思うわ。

jiggawatts 2025/06/11 00:30:09

これは「不正防止」とマーケティングだな。顧客に国家機密気分にさせてモデルを特別に見せるんだ。Samaはこういう心理操作マーケティングで有名だよな。Google+やWaveでGoogleが失敗した「潜在顧客をブロックするマーケティング」だ。俺はGemini Pro 2.5に血とか取られずにアクセスできるぞ。
でも実際は、OpenAIの収益はスパマーとかSEOゴミ生成から結構来てるんだ。彼らが大事な顧客なんだな！

godelski 2025/06/11 23:52:10

「不正／悪用防止が例だ」って？
電話なんてスパムで有名なのに、どうやって不正防止に使うんだよ？スパム電話やテキスト受けたことないんか？詐欺師は悪用する方法知ってるに決まってるだろ…これ以上ないわ。

mitthrowaway2 2025/06/11 14:19:57

無限責任を心配してるなら、クレジットを期限切れにしないで返金したらどうなんだ？

miki123211 2025/06/11 02:23:03

知ってる限りでは、GeminiはAPI経由だと推論を提供しないんだよね。

charliebwrites 2025/06/11 00:42:01

Sam Altmanって、人の生体データを集めて本人確認する暗号通貨の会社[1]持ってなかったっけ？なんか見覚えあるな…[1] https://www.forbes.com/advisor/investing/cryptocurrency/what…

gloosx 2025/06/11 19:36:58

じゃあ、ビデオをAIモデルにただ食わせて、その結果を盲信するだけじゃないってこと？どう動くのか何か証拠あるの？

godelski 2025/06/12 08:58:07

はっきり言って、これじゃ摩擦が足りないんだよ。プライバシーのコストに見合わない。正直、そういう番号って結局同じスパマーに売られちゃうことが多いんだ。それに、番号を偽装したり乗っ取ったり簡単だって忘れてない？だから番号ごとにお金がかかるわけじゃなくて、自分たちの番号を使うことだって多いんだ。普遍的な解決策がないのが問題だね。番号が有効な時もあるけど、ほとんどの場合はそうじゃない。

AstroBen 2025/06/11 00:24:32

同じ週にKYCの義務付けと、OpenAIが全ログ保存？

sneak 2025/06/11 08:08:09

動画とアプリが必要で、顔の生体データを集めてる。

gscott 2025/06/11 08:01:42

中国はChatGPTを使ってAIモデルを訓練してるんだって。それを止めたいか、遅らせたいんだろうね。

sschueller 2025/06/10 19:43:02

みんな気付いてる？OpenAIが「怠惰」になったって。
最近質問すると、完全なファイルとか修正じゃなくて、どうすればいいか言うだけなんだ。結局、やって欲しいことを頼むのに2回も3回も聞かないといけないんだよ。
DeepSeekとかだとこんなことないのに。
もしかして、ああいう答え方することでリソース節約してんのかな？

tedsanders 2025/06/10 20:24:32

(OpenAI社員だけど)うん、うちのモデル、たまに怠惰すぎるんだよね。わざとじゃないし、将来のモデルはもっと怠惰じゃなくなるよ。
Netflixにいた頃も、意図的に変なオススメ出してストリーミング減らして利益増やそうとしてるんじゃないかって同じような憶測聞いたけど、ストリーミング費用なんて1ペニー以下だから、そっちの方が意味不明だったな。
実際はさ、完璧な製品作るのが難しいだけなんだ！

ukblewis 2025/06/10 21:44:49

他の選択肢には気をつけてね。o3はシンプルな問題なのにツールコールとか調査をやりすぎてるのを見たことあるよ。

jillesvangurp 2025/06/11 06:45:17

そうそう、意味なくてもすぐWeb検索するんだよね。
例えば、何か書かせた後で、それをmarkdown形式でくれって頼んだとするじゃん。必要な情報は全部会話の中にあるのに、Web検索とか色々やってまるまる1分かかったんだよ。
俺、このせいでo3使うの正直嫌いなんだ。デフォルトは4oにしてるんだけど、たまに戻すの忘れてさ、簡単な質問に答えるために海を沸騰させる勢いで検索し始めるんだ。ちょっとツールに頼りすぎなんだよね。
大体、このバージョンとかモデルのゴチャゴチャ、技術詳しくない人には全く分からないと思うよ。
4oも最近同じようなことし始めた気がするし、多分多くのユーザーがモデルのドロップダウンを使わないんだろうね。

Hard_Space 2025/06/11 06:02:22

ここ数週間、o3がツール検索したり、失敗した生成を無理やり直そうとしたり（それについて質問しただけなのに）するのを見て、ポリシーでクレジットを最速で消費させようとしてるんだと思ってたんだけど、今回の値下げで何が起きてるのかもう分かんないや…。

Nextgrid 2025/06/11 18:11:40

OpenAIって実際利益出てるの？クレジットを消費させるポリシーは、1トークンごとに利益が出てるなら意味あるけど、そうじゃないなら逆効果になるんじゃん。

jazzyjackson 2025/06/11 02:20:58

俺の意見だけど、単にモデルがすごく非決定的で、人によって全然違う種類の応答が得られるだけだと思うんだ。
最初に使ってみて全く使えなかったからやめたって人もいっぱい会ったし、俺みたいにビックリするほど最高の応答が得られて、AGIがすぐそこだって感じた人もいたよ。
でも、コイン投げみたいに十分な回数やると、運が尽きて怠惰な応答が来るんだ。
運がいい人もいればそうじゃない人もいて、周りのみんながダメだって言うのがなんでだろって思ってる人もいるんだよね。

もっとコメントを表示（1）

anshumankmr 2025/06/11 06:16:49

GPT4-Turboには結構深刻な「怠惰」問題があったんだよ、マジでヤバかった。1年くらい前にこれについて投稿したことがあるんだ。
URL: https://news.ycombinator.com/item?id=39985596#39987726
怠惰な問題が改善されてないとは言ってないけど、個人的な経験としてはやっぱり起こるんだよね。
Gemini 2.5 Flashで何か作ってる時にも、似たような「怠惰」な応答が来たし。

0x1ceb00da 2025/06/11 03:10:49

良いと思うな。最初はモデルもミスするだろうし、全部やらずにユーザーに方向性だけ伝えるのは、間違いを修正するチャンスになって助かるよ。

thimabi 2025/06/11 00:38:07

OpenAIが最高の“怠けない”モデルをみんなが使いやすくする上で、どんな大きな課題にぶつかってるか教えてくれる？

TillE 2025/06/10 23:40:21

この前化学計算で「[X]対[Y]のグラフ作って」って頼んだら、色々説明して「もしグラフが必要なら教えてね！」だって。え、それ頼んだんだけど笑
面白い経験だったよ。

csomar 2025/06/11 04:49:15

それは“怠惰さ”じゃなくて、たぶんAgentのチューニングの問題じゃないかな。

mythz 2025/06/11 07:42:28

OpenAIにはちょっとうんざりしてて、しばらく使ってないんだけど、Sonnet 4とかGemini Pro 2.5の質が良いから別に困らないんだ。
でも、o3のあのめちゃくちゃ高い値段でよくやってられたな、他のどのモデルより何が優れてて、あのプレミアム価格が正当化されてたんだろう？ってずっと思ってたんだよね。

jstummbillig 2025/06/11 10:09:40

この分野はまだ全然最適化されてないんだよ。市場もまだ固まってなくて、みんな手探りだから結果もプロセスもコストも全然違う。結局はただのutf-8文字なのにね。o3は動かすのがすごく高かったんだろうけど、今はそうじゃなくなって、価格でsonnet/opus 4に勝てるなんて、かなりすごいことだ。

jsnider3 2025/06/11 17:00:40

コストでモデルを選ぶ顧客なんてすごく少ないよ。多くの人にとってChatGPTが知ってる唯一のモデルだからね。

hu3 2025/06/11 17:21:22

＞コストでモデルを選ぶ顧客なんてすごく少ないよ。
何？私がコンサルした4社中3社は、コーディングにAIを使う時にコストを重要な条件にしてたけど。残り1社は資金がほぼ無限だから気にしないだけだよ。

jsnider3 2025/06/11 17:29:27

＞私がコンサルした4社中3社は、コーディングにAIを使う時にコストを重要な条件にしてたけど。
でもそれって普通の顧客じゃないでしょ。

lvl155 2025/06/10 18:30:40

Googleも追い上げてきてるね。
この分野の進化ってホント速いよ。
つい数ヶ月前はDeepSeekの話ばっかだったのにね。

bitpush 2025/06/10 18:44:12

多くの人がGoogleのGeminiモデルはSOTAだって言うね。
Claudeもコーディングタスクは得意みたいだけど。

snarf21 2025/06/10 18:52:08

コーディングプロジェクトではGeminiの方がClaudeより良かったよ。
Claudeはコード更新したって言うのに、出力にはそれが反映されてなかったんだ。
更新された出力を得るためだけに、5回も再プロンプトしなきゃいけなかったよ。

jacob019 2025/06/10 19:15:27

Claudeは遅くて冗長だけど指示遵守が良い。詰まったらGemini 2.5 proを使うよ。
Geminiはコンテキスト理解が深く、Claudeが見落とすedge caseバグを見つけられる。
o3（GPT-4oかな）は高レベル思考や計画が得意。
それぞれ強みが違う同僚みたいだね。
o3はコストで使ってなかったけど、これからはもっと使うかも。

ookdatnog 2025/06/11 07:55:35

もし競争が「誰が一番質の高いデータにアクセスできるか」にかかってるなら、結局はGoogle以外勝てないんじゃないかな。
Google Booksで何千万冊もスキャンしてるし、出版された本が一番質の高いテキストだからね。

itake 2025/06/11 12:36:34

ベトナム語を勉強してるんだ。
残念ながら、RedditとかFacebookみたいなSNSには新しい言葉遣いが多いんだよね。
若い世代は略語や頭字語を使いすぎて、ChatGPTとかGoogle Translateもついていけないんだ。
もし「古い文体のちゃんとした文章」が目的なら、君の言う通りだと思うよ。

ookdatnog 2025/06/11 15:35:36

単なるスタイルだけの問題じゃないと思うな。
本にあるテキストは情報密度が高く、複雑な議論を含んでるって考えるのが妥当みたい。
（SNS投稿とかと比べるとね）
賢いモデルには、こういう質の高いコンテンツで学習させる必要があると思うよ。
古い文体なのはたまたまだね。
大学の教科書をSNSスラングで書き直しても、高品質なテキストだと思うな。

johan914 2025/06/10 19:12:41

ここ数ヶ月Googleのモデルを使ってるんだけど、今のChatGPTがいかにsycophantic（おべっか使い）か見て驚いたよ。
応答の最初や最後だけじゃなくて、markdownの中にまで散りばめられてるんだ。
内容は薄いのにね。
スタイルを変えてって頼むと、今度は技術用語を使いすぎたりするんだ。

malshe 2025/06/11 21:40:25

同じタスクでDeepSeekが他のモデルよりずっとhallucination（幻覚）が多いって気づいたんだけど、他の人も経験したことある？

resource_waste 2025/06/11 00:15:39

DeepSeekはモデルをダウンロードできたからワクワクしたんだよね。
Gemini 2.5が出てからは、どうやら3位みたいだよ。

Squarex 2025/06/11 09:23:52

Google、OpenAI、Anthropicの次に位置づけたいかな。でもオープンウェイトLLMの中では一番だよ。

behnamoh 2025/06/10 18:07:28

o3が量子化版じゃないってどうやってわかるの？
ベンチマーク良くするためにフルモデル発表して、後で徐々に量子化するんじゃないの？
gpt-4-turboがすぐ出たのもそのせいかもね。
個人的には元のGPT-4より質が悪いけど、会社がベンチマーク最適化したからユーザーは満足してるのかも。

CSMastermind 2025/06/10 18:37:27

きっと彼らはこれをやってるよ。元のo3モデルを「o3-pro」として名前変えてるんだ。

tedsanders 2025/06/10 20:16:11

いやいや、それはやってないよ。
o3は元のままで、o3-proは新しくてo3より優れてる。
もし嘘なら、評価すればすぐわかるよ。（OpenAI社員より）

lispisok 2025/06/10 18:15:48

新しいモデルって最初はすごく良いのに、だんだん性能が悪くなる気がするんだよね。
悪い出力をなくすためにファインチューニングして、良い出力もナーフしちゃったのかと思ってたけど、もしかして量子化してるのかな？

bn-l 2025/06/10 21:41:29

量子化してないの？

tedsanders 2025/06/10 22:29:22

量子化してないよ。重みは同じままだよ。
もしモデルを変えるなら、APIで新しい名前で出すはず。
API使ってるお客さんにとって、こっそり変えるのはすごく迷惑だから、そんなことしないんだ。ただ「chatgpt-4o-latest」は例外だけどね。

thegeomaster 2025/06/10 23:27:51

GoogleはせめてOpenAIのこの態度を見習ってほしいね。
最近03-25から05-06へのモデル名を何の通知もなしに切り替えたんだからさ。

Tiberium 2025/06/10 18:40:20

「モデルの劣化」ってよく聞くけど、それを裏付ける客観的なベンチマークはないんだよね。
単に新しいモデルへの興奮が冷めて、欠点に気づくだけじゃないのかな？

johnb231 2025/06/11 01:09:25

それはプレビュー／ベータ版のモデルだから、安定性は期待できないよ。
Googleは何も間違ってないし、誰も本番環境でプレビューモデルを使うべきじゃないね。

もっとコメントを表示（2）

thegeomaster 2025/06/11 01:54:14

全然同意できないな。もちろん技術的には公開されてるガイドラインに明示的に違反してないのは確かだけど（チェック機能が許さないだろうし）、モデル名に日付を入れるのは「変わらない」ってのを強く匂わせるじゃん。これって、C/C++のUB（未定義動作）がコンパイラに何でも好き勝手やっていいライセンスにならないのと同じ理屈だよ。俺たちは人間で、暗黙の了解とか、当たり前の前提とか、信頼に基づいて行動してるんだから。

johnb231 2025/06/11 03:18:43

そのモデルはPreviewとしてラベル付けされてるよ。Previewモデルに安定性や提供の保証なんてないし、本番ワークロード向けじゃないんだ。
https://cloud.google.com/products?hl=en#product-launch-stage…
“At Preview, products or features are ready for testing by customers. Preview offerings are often publicly announced, but are not necessarily feature-complete, and no SLAs or technical support commitments are provided for these. Unless stated otherwise by Google, Preview offerings are intended for use in test environments only. The average Preview stage lasts about six months.“

nabla9 2025/06/10 18:26:05

どうやら少なくともGoogleは計算能力を過剰に宣伝してるみたいだね。月額料金払ってるのに、北米が働いてる時間帯の5〜6時間はGeminiが完全に詰まるんだよ。

refulgentis 2025/06/11 03:27:32

11月以降、PreviewじゃないGeminiなんて出てないんじゃない？Previewって言ってるけど、他のとこのリリース頻度と変わんないよ。“preview”ってのはLaunchcal（Googleの内部承認ツール、つまり「waveは二度と起きない」）で承認に必要なサインオフが少なくなる魔法の杖ってだけ。で、日付付きモデルが勝手に新しいのに差し替えられるようになったんだけど、あれはこっちに好意でやってるって…まぁ、少なくとも斬新なアイデアだとは言えるよね。Googleの誰かは、これをPreviewだからって片付けて、コストが同じで良くなってるなら損はないって感覚に基づいてるんだって言われたらちょっとビックリするんじゃないかな。
彼らが間違ってるかは分からないけど、これによって「2^N個の設定と5ビットがあるから、誰もどう動くか知らない」みたいな状況になっちゃうんだよ。例えば、05-06も06-05にアップグレードされたけど、実際は違った。アップグレード後に05-06に可変思考を送ると失敗したし。（Gemini 2.5 flashの思考設定とか、05-06 vs 06-05と0思考の5つの異なる思考設定についてはもう言うまでもないけど）

baq 2025/06/10 18:44:54

Geminiはシンプルにそれくらい良いってことだよ。たまにClaude 4を試すけど、その度にGeminiに戻って Claudeの mess を直してる…

energy123 2025/06/11 03:32:37

それって、o3 (low)、o3 (medium)？それとも o3 (high)？この数ヶ月で色々なベンチマークに異なるモデル名がこっそり出てきてるんだよね。

refulgentis 2025/06/11 04:10:11

だから、規約を引用する以外に何か貢献することもないし、それ以外のことに興味もないってこと？なんでエンジニアリングニュースサイトのコメント欄にいるわけ？
（注意：あなたの、ちょっと失礼だけど、何も知らないって感じの返信以外にも、あなたが引用してる規約は、周りの人が実際に議論してることとは何の関係もないんだよ。たとえあなたが頑張ってそう見せようとしてもね。「新しいサービスに入れ替えるかもしれない、おめでとう！」なんて書いてないし、それについて何も言ってない。あなたの法律用語は、せいぜい05-06を終了する理由を説明してるだけで、05-06が06-05に進むことについては何も触れてない。これは斬新なアイデアなんだよ。）

tedsanders 2025/06/11 04:55:19

o3はモデルで、思考努力 (high/medium/low) はモデルに入るパラメータだよ。o3 proは別物で、単に最大の思考努力を使ったo3じゃないんだ。

johnb231 2025/06/11 04:13:50

この件は単に、みんなが利用規約を理解してなかったってだけ。他に言うことはないよ。それくらいシンプルだ。「エンジニア」なら本番にデプロイする前にそれくらい知っておくべきだろ。基本的な能力だよ。
そして、あなたが何を言おうとしてるのか、私は本当に理解できない。解析できなかったね。

herval 2025/06/10 18:46:45

ベンチマークは少ないけど、どうやら日中にモデルがスロットリングされるみたいだね（ClaudeとかWindsurf／Cursorでツールコーリングがうまくいかない時がある）。
OpenAIもGPT-4oのシコファンシー問題があったって認めてるよ（https://openai.com/index/sycophancy-in-gpt-4o/）。
ベンチマークは高くて常に実行されてないだろうけど、体感的には明らかだよ。

esafak 2025/06/10 18:09:03

過去のパフォーマンスを追跡してるベンチマークってある？
知りたいな。

tauntz 2025/06/11 09:16:05

なんで違うのにo3って呼ぶのかな？
モデル名の混乱がひどすぎるよ。
どれが「一番良い」モデルか全然分からないんだよね。
バージョン名の構成要素（gpt-、o1, o3, o4, 4o, nano, mini, pro, turbo, audio, search, preview, latest, 日付、16kとか）を勝手に推測してみたけど、めっちゃくちゃだよね。
これじゃあ、一番大きい数字のモデルが一番良いって思っちゃうのも無理ないよ。
（モデルファミリーの順位付けも推測してるよ）

refulgentis 2025/06/11 04:16:37

あのさ、キミ（John）が引用してるのは「サービスを停止する権利はある」って書いてあって、「新しいサービスに入れ替える権利がある」とは言ってないって理解してる？
たとえそう書いてあったとしても、実際は違ったし、よく分からない半端なものだったじゃん？
ボクはGeminiのプレビューモデルを安易に使うことについてはキミと全く同じ意見だよ。
でも15年もこのサイトにいて、キミの議論のスタイルにはちょっと驚きだよ。
「プロバイダーがサービスを勝手に変えた！」って話を、「いや、停止できるって書いてあったんだから、初めてサービスが変わることを予想すべきだったでしょ！」ってすり替えるなんてね。
他のエンジニアの質を軽蔑するような態度もね。

anticensor 2025/06/10 18:40:55

-proモデルは、元のフルサイズモデルの出力からベストな10個を選んでるみたいだよ。

MattDaEskimo 2025/06/10 22:53:47

元のo3リリースと比べてベンチマーク性能が落ちてるのはどういうこと？
o4-miniが入ってなかったのも残念だったな。

energy123 2025/06/10 19:19:56

Geminiは世界最高のモデルなのに、Webアプリは世界最悪だよ。
この二つがどうにか共存してるんだから信じられないね。
UIチームのWeb開発者は、MLチームやハードウェアチームの頑張りを本当に台無しにしてるよ。
適当に言ってるんじゃない。
数え切れないほど（片手どころじゃない）の致命的なバグが1年以上も放置されてるのを見てきたからね。
彼らは無関心か、ひどく無能かのどっちかだよ。

Szpadel 2025/06/10 19:03:55

best of Xって舞台裏でどうやってサンプリングしてるの？
X個生成して一番良いのを選ぶって意味なら、自動化できたらトップ5モデルを並列で実行して毎回一番良い答えを選べるからゲームチェンジャーだよね。
でも現実的じゃないのは、5つの回答全部読んで比較しなきゃいけないから、キミ自身がボトルネックになるからだよ。

hyperknot 2025/06/10 19:37:16

o3のアナウンス後、700+トークン/秒出たよ。
かなり量子化されたバージョンだと思うんだ。
（https://x.com/hyperknot/status/1932476190608036243）

記事一覧へ

著者

海外テックの反応まとめ

暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。