DeepSeekの推論エンジン、ついにオープンソース化へ！高速化の裏側と今後の展望を徹底解剖

DeepSeekの推論エンジン、ついにオープンソース化へ！高速化の裏側と今後の展望を徹底解剖

引用元：https://news.ycombinator.com/item?id=43682088

ozgune 2025-04-14T18:04:41

3月にvLLMがDeepSeekの論文の改善点を取り入れたみたいで、vLLM v0.7.3のDeepSeekの性能が3倍以上になったらしいよ[1]！まだまだ改善の余地があるのがワクワクするね。vLLMを使って、sharegptデータセットで5Kトークン/秒、ランダム2000/100で12Kトークン/秒をベンチマークしてるんだって。DeepSeek-V3/R1 Inference System Overview [2]では、H800ノード1つでプリフィル中に平均73.7kトークン/秒、デコード中に14.8kトークン/秒のスループットが出るって書いてある。DeepSeekは違うアーキテクチャだけど、まだまだ伸びしろがあるってことだね！

vintagedave 2025-04-14T17:23:12

＞Codebase Divergence：Our engine is based on an early fork of vLLM from over a year ago．Although structurally similar，we’ve heavily customized it for DeepSeek models，making it difficult to extend for broader use cases．”
わかるー！あるあるだよねー！
メンテしやすいサブライブラリに分割して、統合されてなくても情報を共有するってアプローチはマジ良いと思う。障害があっても、それを理由に貢献しないって方向に逃げないのがすごい。動くコードだけじゃなくて、技術の情報も共有してくれるのはありがたいよね。やるのめんどくさいはずなのに、マジ感謝だわ。

bonoboTP 2025-04-14T18:18:52

動かないコードもめっちゃ役に立つんだよね。論文に書いてあることが曖昧な時とか、実際に何やったのか確認したいから、動かなくてもいいからコードが見たい時あるもん。

rvnx 2025-04-14T17:25:22

DeepSeekはvLLMをめっちゃカスタマイズして最適化したから、もはや別物になったんだね（例：DebianとUbuntuみたいな）。でも、改善点を共有してくれるのはマジでありがたい。

avodonosov 2025-04-14T20:19:29

なんでAI企業って研究結果とかノウハウを共有するんだろう？ GoogleがTransformerのアーキテクチャを独り占めしなかったのはなんで？人類のためとか、進歩を促進するためってのはわかるけど、商業的な利益に反する場合、経営陣はどうやって株主の反対を押し切るんだろう？情報や知的財産を共有することに商業的な理由があるのかな？あるとしたらどんなロジックなんだろう？

nodja 2025-04-14T21:44:05

俺の理解では、最先端の研究者は、論文を発表したり、仲間と議論したりさせてくれる会社で働くんだよね。 AI研究者のレベルになると、今の年収500kに100k上乗せされるよりも、名前が知られる方が価値があるんだと思う（金額は適当）。例えば、Transformerを作った作者の一人として知られるようになれば、優秀な人たちと一緒にさらに良いものを作れるじゃん。だから、こういう企業は「うちで働けば論文を発表できるよ」ってのを特典にしてるんだよね。

htrp 2025-04-15T00:16:02

＞When you’re an engineer at the tier of these AI researchers，winning an extra 100k/year on top of you current 500k (numbers out of my ass) is not worth it vs getting name recognition．Being known as one of the authors that made the transformer for example will enable you work with other bright minded individuals and create even better things．”
年収が100kドル増える代わりに、次の会社のために10億ドルのVC資金を調達できるんだぜ。

make3 2025-04-15T06:12:17

そして、Googleに買い戻される、と。 https://www.axios.com/2024/08/05/google-characterai-venture-…

timClicks 2025-04-15T09:53:58

商業的に有効な戦略はいくつかあるよ。
1．善意とマインドシェア。「最高」とか「最も革新的」として知られていれば、顧客を引きつけられる。
2．人材獲得。賢い人は賢い人と一緒に働くのが好き。
3．標準になる。技術が広く採用され、最も長く使用していれば、業界で最も有利な立場になれる。
4．欺瞞。内部的には「古い」が、まだ最先端の研究を発表することがある。
5．他者の仕事に便乗。アイデアを拡張する実験が高すぎる場合、スタートアップが試すかも。
6．市場リーダーを弱体化。業界に明確なリーダーがいる場合、オープンソースで協力してリーダーシップを低下させることができる。

anon373839 2025-04-15T03:27:47

＞Or there is a commercial logic that motivates sharing of information and intellectual property？ What logic is that？”
研究を共有することには、長期的な成長という正当な商業的理由があるんだよ。（オープンな研究がなければ、ディープラーニングはここまで進歩しなかった！）短期的なことばかり考えてるからそう思うんだよ。

ENGNR 2025-04-15T07:07:08

それに、どうせ漏れるんじゃない？ただのアイデアで、人に頼んで開発するなら、人が出入りするわけだし。セキュリティにお金をかけるより、中途半端でも短期的な利益を得た方がマシかもね。

esperent 2025-04-15T04:13:05

Googleみたいな会社が短期的なウォール街的な考え方をするのはよくあることだよね。論文の共有に関しては利他的に見えるけど、なんでだろう？本当に利他主義だとは思えないな。取引的な行動がそう見えるだけじゃないかな。

robertlagrant 2025-04-15T10:59:41

＞Googleみたいな会社が短期的なウォール街的な考え方をするのはよくあることだよね”
世界中の会社の中で、Googleが発見して公開したもののことを考えたら、最下位グループには入らないと思うけどね。

kmacdough 2025-04-15T09:14:47

この分野は急速に発展していて、進歩の多くはオープンソースモデルの小さな研究室で起こってる。いずれ安定するだろうけど、今はオープンでサポートすることで、進歩に近づき、落ち着いた時に有利な立場にいられるように賭けてるんだね。

anon373839 2025-04-15T07:43:14

利他主義じゃないって！相互利益を通じて経済的な利益を追求する、良いビジネスだよ。

avodonosov 2025-04-15T05:50:01

人は利他的かもしれないけど、会社ではそうはいかないこともあるよね。CEOの決定は株主の財産に影響を与えるから、自由に利他的な目標を追求できないんだ。
Dodge v. Ford Motor Co.はアメリカの重要な判例だって聞いたよ。
https://en.m.wikipedia.org/wiki/Dodge_v._Ford_Motor_Co

owisd 2025-04-15T18:27:38

最近の裁判所は、会社が表面上は利他的な行為が実際には株主価値にとって長期的に良い理由を説明するのを広く認めてる。Fordがやったことをやりたい人は、本当の理由を黙っておけばいいんだ。

avodonosov 2025-04-15T20:30:53

興味深いね。何か特定の裁判例を知ってる？
上のWikipediaのリンクは https://en.m.wikipedia.org/wiki/Shareholder_primacy につながっていて、最後の段落に「そのドクトリンは後に衰退した」と書いてあるね。たぶんあなたの言う通りだけど、具体的な事例について知りたいな。

andai 2025-04-15T05:14:36

みんな利益を得て、顧客も投資も増える。

Der_Einzige 2025-04-14T22:06:43

ACLとかNeurIPS、ICLRみたいなAIの専門機関があるから、こういうことが起こるんだよ。全部オープンソースにしないといけないし、アクセスにお金もかからない。これは急速なイノベーションのための理想的なオープンな学術環境なんだ。計算手段の民主化に怒る人たちからの攻撃を防がないと。
それに、AIには著作権廃止論者がたくさんいる。特に自分の情報を無料で公開することに喜びを感じてる人も多いんだ。
Aaron Swartzの幽霊がこの分野の研究者全員に乗り移ってるんだ。

もっとコメントを表示（1）

larodi 2025-04-15T01:18:57

マジで、GoogleはTransformerが最終的に何に使われるか、ちゃんと評価しなかったんじゃない？元々はseq2seqの改良として翻訳のために作られたんだよね？翻訳のためであって、思考のためじゃなかったはず。ある意味、今でも翻訳がメインで、他の能力はパラメータが大きくなった時に偶然見つかった副作用なんじゃないかな？

bcoughlan 2025-04-14T21:31:03

世界のトップ研究者たちは、自分たちの研究成果をオープンにしたいってことなんじゃないかな。

behnamoh 2025-04-14T23:21:32

Ilyaは違うよ。彼はクローズドソースと検閲の強い支持者だよ。

esperent 2025-04-15T04:15:12

彼もただの一人に過ぎないよ。たまたま、この分野がゴールドラッシュになった時に一番有名な科学者だったってだけで、彼以前の人たちの肩に乗って築かれたものなんだから。彼らの発見も同じくらい重要だよ。

Zambyte 2025-04-15T11:00:59

Totally Safe Intelligenceが、Totally Open AIと同じ関係にならないと良いけどね。

lofaszvanitt 2025-04-14T20:31:29

みんなが君の古いものをコピーすればするほど、君にとっては有利だよ。だって、みんな必ず君に遅れを取るからね。

Kholin 2025-04-15T00:16:20

これはGoogleのビジネスモデルに関係あるかも。Googleの主要事業である検索エンジンと広告は、どちらもオープンなウェブのエコシステムに依存してる。だから、Googleはずっとオープンソースやオープンなウェブに友好的な態度を維持してきた。ChromiumとかNoto fonts、Go、Flutterとかもそう。オープンなウェブに役立つインフラツールを提供することで、Googleは検索可能なコンテンツと広告のリーチを拡大してる。ウェブのエコシステム全体が恩恵を受けると、Googleも最終的に利益を得られるってわけ。このモデルは、みんなが受益者であり、自然と貢献者になるオープンソースコミュニティの哲学とも一致してるんだよね。

0x008 2025-04-15T05:43:56

主要な研究機関には共通点が一つある。それは、ほぼ無制限のデータと金を持っていること。でも、無制限じゃないのは才能とアイデアなんだ。だから、「すべてのアイデアを雇う」必要がないようにしてるんだね。

choonway 2025-04-15T08:05:52

研究成果の発表を許可しないと、優秀な人材はみんな辞めていくよ。俺も昔、そういう制限の多い環境で働いてたけど、長くいる価値のある人はいなかったな。

bobxmax 2025-04-15T08:57:27

注目すべき論文ではあるけど、Transformerが最終的にブレイクスルーになるとは誰も予想してなかったってことは覚えておいた方がいいよ。

avodonosov 2025-04-16T00:39:47

Transformerはただの例だよ。企業が情報を共有するのは今に始まったことじゃないってこと。特に今は”AI”がめっちゃ盛り上がってるし。

nialv7 2025-04-15T09:50:26

2017年当時は、AIってまだ製品化されてなかったじゃん？Transformerを作った人たちは研究者で、研究結果を発表するのが当たり前だったんだよね。

xwolfi 2025-04-14T23:49:11

Deepseekの生き残りは、どれだけ話題になるかにかかってるんだよ。一発当てただけじゃ投資家からもっとお金を引き出せないし。色んなツールとか革新的な発見でAIエコシステムに深く関わっていく方が、最初の成功を秘密にしておくよりもずっと得策だと思うぜ。

WiSaGaN 2025-04-15T02:14:09

Deepseekは話題になんなくても大丈夫。今はビリオネアの創業者に資金援助してもらってるから。

runeks 2025-04-15T07:52:42

＞なんでGoogleはTransformerのアーキテクチャを公開したんだろ？自分たちだけで使ってればよかったのに。
広告で稼いでるからだよ。AIモデルからじゃないんだよね。Metaも同じ。OpenAIはAIモデルで稼ごうとしてるから、GoogleとかMetaに価格競争で負けちゃうんだ。

HH_GU 2025-04-15T07:51:18

DEEPSEEKっていう会社名が示す通り、あそこは商業的な会社でAIに投資してるけど、創業者はもっと大きな目標を持ってるんだよ。お金はただの数字で、もっと色々やりたいんだって。特にDEEPSEEKではね。

victorbjorklund 2025-04-15T12:46:19

もしGoogleがTransformerを発表してなかったら（情報漏洩もしなかったとして）、今のLLMは存在しなかっただろうね（Googleのも含めて）。誰も得しなかったと思うよ。

buyucu 2025-04-15T11:12:24

Deepseekは商業AI企業じゃないよ。ヘッジファンドの趣味みたいなもんで、片手間でやってるんだって。名誉とか楽しみのためにね。

londons_explore 2025-04-14T23:08:20

「オープンソースコミュニティが興味を持ちそうなものがあるんだけど、うちの会社以外じゃ動かないくらいぐちゃぐちゃで、公開してもちゃんとメンテする人員がいないんだよね」って会社、いっぱいあると思うよ。
「メンテしません。フォークはご自由に！」って書いて、とにかくオープンソースにしてほしい。

lolinder 2025-04-15T03:00:16

残念ながら、今のオープンソースの状況じゃそれは難しいんだよね。権利ばかり主張するユーザーが山ほどいて、オープンソース化されたプロジェクトを食い物にするんだ。個人でメンテしてるなら逃げられるけど、企業だとFOSSプロジェクトがきちんと動いてないことによるイメージダウンの方が、オープンソース化するメリットより大きくなっちゃうんだよ。

もっとコメントを表示（2）

golergka 2025-04-15T03:24:56

issueとかフィードバックチャンネルを全部disableにすればいいじゃん。会社のオープンソースライブラリの状態を見て判断するけど、会社のポジショニング次第だよね。Facebookはreactをデフォルトのフレームワークにしようとしたから、ダメなときは厳しく見られるのは当然。でも、ちゃんと免責事項があれば、みんな期待すること変わるんじゃないかな。

lolinder 2025-04-15T05:56:07

そうかもね。でもFOSSコードのユーザーってめっちゃ理不尽なこと言うやついるからなー。

boredatoms 2025-04-15T05:15:40

シンプルなウェブサイトにtarballのURL置くだけで良くね？コード共有するのにコミュニティとの交流なんていらないっしょ。

3abiton 2025-04-15T06:48:06

＞オープンソース化されたプロジェクトに寄生する、権利ばかり主張するユーザーってめっちゃ多いんだよね。
AOSPで経験済みだけど、すぐには変わらないと思う。残念ながら、オープンソースのエチケットを学ぶnoobなんていないと思うよ。

oldgun 2025-04-14T17:15:33

いいね。DeepSeekは良いエンジニアリングしてるよね。これからも期待してる。

jimmydoe 2025-04-14T18:40:33

マジそれな。アメリカがオープンソースに課税する方法考え出す前にやってほしいわ。

fragmede 2025-04-14T22:33:30

https://www。instagram。com/reel/DIVBmgUvFsN/

holoduke 2025-04-14T19:29:08

大量のAIツールとかモデルのオープンソース公開って、中国がアメリカの支配に対抗するための戦略だったりするのかな？市場にとっては良いことだけど。

jeffrallen 2025-04-15T05:21:40

もしかしてDeepSeekって実は最初のGenAIで、オープンソース化こそが選んだ道だったりして？生物の情報が新しい場所で増殖しようとするみたいに。ウイルスとか菌類には利用規約とかないしね。:)

animal531 2025-04-15T10:34:43

2ヶ月くらいコードのアシスタントとして使ってみたけど、無料のChatGPTより全然ダメだった。バグが多いし、質問を理解してくれないし、間違ったコード生成するし。誘導しても問題を修正できないことが多いから、自分で全部やった方がマシ。その2ヶ月でGPTも改善されて、生成速度も速くなったし、質も良くなった。

CrimpCity 2025-04-15T10:38:44

それ面白いね。俺の経験と真逆だわ。何のコーディングしてるの？DeepSeekのローカルモデルで自作のコーディングアシスタント作ったの？それともウェブ経由でプロンプトしてる感じ？

tvshtr 2025-04-16T05:55:29

わかるー。推論モデルめっちゃ使えるよね。

gizmodo59 2025-04-15T11:23:10

ローカルで色々いじりたい気持ちもめっちゃわかるけど、金があるならSaaS使いたいんだよね。新しいアプリ作ることに時間使いたいし、セットアップとかインフラとか触りたくない。ChatGPTが今の機能維持してくれるなら、もっと払ってもいい。DeepSeek以降、機能も充実してるし（モデルも頻繁に出るし、画像生成もマジ最強だし、推論も6ヶ月前に比べてめっちゃ速いし、細かいところも色々改善されてる）。
でもたまに罪悪感感じるんだよね。こんなすごい力があるのに、アイデア不足と実行力不足で全然活かせてないっていう。

buyucu 2025-04-15T11:17:21

DeepseekはOpenAIが言ってること全部実現してる感じ。

wseqyrku 2025-04-16T03:20:23

DeepSeekだけがOpenAIの隣で「AGI目指してます」って堂々と言える会社だよね。

rfoo 2025-04-14T15:37:33

要するに「vLLMをフォークしたけど、もうメンテできなくなっちゃった。だから今度はちゃんと公開する形で作り直すわ」ってことね。

lukeschlather 2025-04-14T16:24:31

彼らのセットアップはめっちゃメンテ大変そうだけど、払う価値はあると思う。ハードウェアの性能を最大限に引き出すための最適化を色々してるんだろうね。特定の構成のマシン使ってたり、一部の処理で100％スピードアップするような複雑なハックがあったりしても驚かない。でも、マザーボードの構成がちょっと違うだけでそのスピードアップが消えちゃうとかね。ファームウェアのハックもしてる可能性あるし、スケールメリットがあるからこそできるけど、小規模でやるのは危険で難しいかも。(ファームウェアとクラスタレベルの最適化が組み合わさってて、単独では役に立たないとか逆効果になる場合もあるだろうし)
似たようなハードウェア持ってても、そのコードが役に立つとは限らないし、解決策のスケッチだけ参考にして自分で実装した方がいいかも。大規模なクラスタ持ってるなら、どうせすぐに元取れるし。

Havoc 2025-04-14T16:09:52

メンテできないって言うのはちょっと言い過ぎじゃない？社内でメンテできる状態と、一般公開できる状態の間には大きな隔たりがあると思うよ。

rfoo 2025-04-14T18:33:41

＞Codebase Divergence：うちのエンジンは1年以上前のvLLMの初期フォーク版をベースにしてる
同じような状況ならわかると思うけど、vLLMは1年前と比べてめっちゃ変わってるんだよね。つまり、1年以上リベースしてないってことで、それはしたくないんじゃなくて、実質的にできないからだと思う。
もちろん、現状維持はできるだろうけど、コミュニティのものを移植するのはどんどん難しくなるよね。

maknee 2025-04-14T16:32:14

彼らは最適化を公開するために時間と労力を費やすつもりなんだよ。彼らが変更を内部に留めておく方が良かった？

もっとコメントを表示（3）

nashashmi 2025-04-14T19:03:02

これって検閲を実装する一つの方法って感じがするな。

sampton 2025-04-14T19:21:50

LLMが潜在空間からトークンを生成してるだけで知能があるって言えるのかって議論があるよね。でも、たった5つのトークンしか吐き出せない人間でも「知的」って見なされるんだから、なんか考えさせられるな。

xwolfi 2025-04-14T23:50:00

へへへ

記事一覧へ

著者

海外テックの反応まとめ

暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。