メインコンテンツへスキップ

Excel作業にClaude投入!生産性爆上げの期待と、数字の正確性への深い疑念

·4 分
2025/10 AI Excel LLM 生産性向上 ビジネス自動化

Excel作業にClaude投入!生産性爆上げの期待と、数字の正確性への深い疑念

引用元:https://news.ycombinator.com/item?id=45722639

extr 2025/10/27 16:45:12

ネガティブなコメントばかりだね。これは多くのホワイトカラーの仕事に影響する大きな分野だよ。スプレッドシートの基本的な自動化だけでも生産性は上がるはず。
妻は保険業務でExcel漬け。システムからデータ抽出しExcelで結合、解釈、検証、提案する仕事が多いんだ。こういう仕事はAIとExcelの連携が進めば一番に自動化されるだろうね。Sonnet 4.5はすでにその分析レベルを超えられると思う。

Scubabear68 2025/10/27 20:33:37

多くのスプレッドシートを扱ってきた経験から言うと、これは大惨事になるよ。スプレッドシートのUIはすでに悪夢だ。数式編集や関連性の可視化は全然ダメで、間違いが横行してる。
Claudeはこれを改善しないし、むしろ微妙な、あるいは露骨なハルシネーションで事態を悪化させるだろうね。LLMはランダム性に依存してるから、正確なスプレッドシート作成には向かない。ランダムなシードから正確性が生まれるなんて嫌だ。

cube00 2025/10/27 16:48:26

スプレッドシートに必要な正確で決定論的な作業をLLMに任せるのは信用できないな。レポートの要約は主観的でもいいけど、数字は違う。LLMが基本的な計算すら苦手なのはよく知られていることだ。
GoogleのAI要約も認めてるくらいだから、マーケティング担当者は不満だろうね。LLMは数学を論理システムとして理解せず、テキストとして処理してるから計算が苦手なんだよ。

extr 2025/10/27 16:57:25

君はこの仕事が何を意味するか、かなり誤解してるようだね。従業員の仕事は暗算じゃない。顧客ポリシーや支払いを扱うシステムにログインして、過去30日間のポリシーとそれに対応する支払いを確認し、X%以上の不一致を報告する、といった作業が近いんだ。
具体的にはCSVの処理やXLOOKUP、IF関数、条件付き書式設定を使う。AIが仕事全部を置き換えるわけじゃないし、完璧である必要もない。既存の従業員も完璧じゃないし、精度が低いことだってあるんだよ。

pavel_lishin 2025/10/27 16:56:43

心配なのは、保険会社がLLMがスプレッドシートに何かしたせいで、請求を拒否したり、もっとひどいことになったりすることだね。
アレックスがセルに誤入力することでも起こりうるけど、それは追跡して修正するのがはるかに簡単なんだ。

manquer 2025/10/27 18:00:17

彼らはすでにAIを使って、以前よりも多くの請求を却下してるよ。民営の保険会社は、もし可能なら支払いを減らす方法を常に見つけるものさ。
それは利益動機、社会化されたリスク、緩い規制という三拍子が揃ってるからなんだ。

extr 2025/10/27 21:22:01

これは単なる君の感覚?それとも実際にAIを適用したユースケースで観察・測定された信頼性に基づいているの?

Ntrails 2025/10/27 17:58:47

他人のスプレッドシートをチェックするのは最悪だね。会社の基準がしっかりしてればマシだけど。
LLMがフォーマットを正確にしてくれるならチェック作業はかなり楽になるはず。でも、基本的な数式でちゃんとしたことをしてくれるとは信用できないな。一週間前にはGPT-5が「僕は323日齢だけど、誕生日はいつ?」っていう質問でプラスかマイナスかで混乱してたよ。

atleastoptimal 2025/10/27 21:10:12

Hacker Newsには強い反AIバイアスがあるよ。これは、AIに仕事を奪われたり、乗り遅れたりすることへの不安が一部原因だと思うな。

noosphr 2025/10/27 20:41:52

大学卒業後の初仕事で、Windows Updateのせいで1000万ドルを失ったスプレッドシートのバージョン管理システムを作ったんだ。スプレッドシートって、もう災害レベルだよね。

xbmcuser 2025/10/28 07:20:32

LLMとスプレッドシートの一番の組み合わせは、LLMにPythonスクリプトを作らせてデータを操作することだと思うよ。これで職場の生産性はマジで爆上がりするはず。俺はもう何年もLLMで繰り返しのタスクを自動化するPythonスクリプトを作ってるんだ。

AvAn12 2025/10/27 20:02:38

“完璧じゃなくてもいい?”って言うけど、実際は完璧じゃないとダメなんだよ。経営報告は会社の帳簿に載るか、トップの重要な決定に使われるからね。もし間違ってたら大問題になる。アナリストの時間は、ひたすらミスがないか、内容に一貫性があるかをチェックするのに費やされてるんだ。計算は簡単でも、細部の正確性がめちゃくちゃ難しいんだよ。

lionkor 2025/10/27 21:25:17

プロの現場でLLMを使うなら、元投稿者の言う通り。自分でプロンプトを工夫して知識を入れないと、正直使い物にならないゴミしか出てこないよ。それに反対する奴は、たぶん自分で良い仕事ができないタイプ。これはマジな話で、多くの人が楽したいだけで何も学ぼうとしないんだ。

xmprt 2025/10/27 18:19:19

LLMが得意なことを誤解してるんじゃないかな。数学はダメだけど、基本的なコーディングは得意だよ。Excel作業ってほとんどコーディングみたいなもんだから、LLMは意外と向いてると思う。俺が気になるのは、作業チェックの方法。Excelは中身を隠しちゃうから、コードみたいに差分を見たりGitで履歴を追ったりできないのが問題なんだよね。

smithkl42 2025/10/27 19:47:17

もし保険会社の規制が“軽い”って思ってるなら、“重い”規制がどんなもんか考えたらビビると思うよ。(ちなみに俺、保険会社のCTOだから。)

extr 2025/10/27 21:30:56

全く同意できないな。俺は毎日LLMをコーディングに使ってるよ。AGIじゃないし、すぐにベテランエンジニアを置き換えるわけじゃないけど、人間がやる何分の1かの時間で、価値あるタスクを完璧にこなせるすごい奴なんだ。これを否定するなんて、現実を見てないだけだろ。

scosman 2025/10/27 21:59:04

“LLMがランダム性に頼ってる”って言うけど、それはパラメータで調整できるだろ?創造性いらないなら温度とかtop_pを下げればいい。“Claudeは改善しない”ってのも、モデルと人間を比較すればわかること。人間だって間違いだらけなんだし。LLMなら、推論時の計算力でミスを見つけたり排除したりできるんだ。例えば、複数の検証器を走らせるとかね。適当な財務モデルはダメだけど、ちゃんと設計されたシステムなら人間をすぐに超えるか同等になるはずだよ。

sally_glance 2025/10/27 22:59:41

何と比べて“災害”って言ってるの?確かにExcelのトラブルは報告されない損害もあるだろうけど、企業や特注ソフト全体と比べたらどうかな。Y2K問題(3000億~6000億ドル)とか、イギリス郵便局の件(約10億ドル)とか、桁違いの被害が出てる例もあるんだぞ。

lionkor 2025/10/27 21:39:40

能力はあるけど、信頼できないんだよ、それが俺の言いたいこと。たまにすごいコードを一発で出すかと思えば、マジで一週間も頭抱えるようなクソコードも一発で出してくるんだ。上司がプッシュしたやつだと「やり直して」って言えないしな。全然一貫性がないんだよ。

array_key_first 2025/10/28 00:39:21

Excelスプレッドシートってカスタムソフトウェアそのものだよな。独自の要件、計算、アルゴリズムがあるんだからさ。ただ、プログラマーが書くわけじゃないし、バージョン管理もロールバックもできない。監査もデバッグもされないし、QAやQCを通ることも普通はないんだよな。

MattGaiser 2025/10/27 21:12:07

> スプレッドシートの間違いは蔓延している
個人的には、LLMが一番期待できるのは、LLMが特別正確で凄いからってわけじゃないんだ。人間のパフォーマンス全体を評価したら、結局はダメだって言われるからさ。
人間だってスプレッドシートの作業は平凡なレベルだし、Claudeが人間よりミスを増やすとは限らないと思うよ。

mbesto 2025/10/27 21:36:12

親コメじゃないけど、これがLLMの根底にあることだよね。本質的に確率的で、決定的じゃない。まさに親コメが言ってるのはこのことさ。

sothatsit 2025/10/27 21:34:59

Claudeみたいなツールはまだ完璧じゃないけど、GPT-5 Proはソフトウェアのバグを見つけるのが自分より上手いって既に信頼してるんだ。すごく注意しててもね。こういうツールを既存のExcelスプレッドシートのレビューに使うだけで、品質がかなり向上するはずだよ。Excelはソフトウェアよりもエラーが多い気がするし。
とはいえ、Claudeはコードレビュー能力ではまだGPT-5にかなり遅れてるから、Sonnet 4.5にこの新しい分野でどれくらい期待できるかは不明だな。OpenAIはもっと良くできるかもね。

jimbokun 2025/10/27 19:39:20

ランダムに一定割合の請求を却下するのと、同じことになっちゃわないかな?

admdly 2025/10/27 23:33:24

> とはいえ、Claudeはコードレビュー能力ではまだGPT-5にかなり遅れてるから、この新しい分野でSonnet 4.5にどれくらい期待できるか分からないな。OpenAIはもっと良くできるかもね。
他人の意見を見るのはいつも面白いよな。まだまだ評価はバラバラで、「雰囲気」ベースだしね。個人的には、自分の用途だと、どのGPT-5モデルもClaudeより優れてるっていう考え方には共感できないんだ。両方同じようなタスクで日常的に使ってるけどね。

calgoo 2025/10/28 08:08:42

昨日、退職した人の代わりに財務部に大量のデータを渡す必要があってさ。いくつか列でグループ化して欲しいって言われたんだけど、Excelで1時間もかける代わりに、偽のデータを3行作ってLLMに渡したら、Pythonスクリプトを作ってくれたんだ。それを実際のデータセットで実行して、手動で結果を確認したら、無事に財務部に提出できたよ。

extr 2025/10/27 23:14:41

現実のプロセスは、どこもかしこも確率的だよ。理論的な数学と「エンジニアリング」が違うのは、実行したいタスクに対して許容できるレベルまで、これらの確率を管理することなんだ。
人間からだって「確率的」なアウトプットを受け取ってるんだよ。人間だって「Final_Final_v2.xlsx」をボスに送る時、理論的に最適なExcelアウトプットを保証してるわけじゃない。彼らの能力に対する自分のメンタルモデルが、結果をどれだけ信頼するかを教えてくれるんだ。
LLMのアウトプットで同じような信頼を得るためのプロセスを構築するのも、このゲームの一部だよ。

manquer 2025/10/27 20:16:42

「軽い」って言ったのは、書類仕事の量が多いって意味じゃなくて、会社としてやりたいことをやらせてもらえるかってことだよ。
コンプライアンスや報告の要件が増えると、大抵はそれに対応できる既存の大手企業が有利になるんだ。それが利用されて、ユーザーの生活を困難にしたり、より多くの請求を拒否したりするんだよ。
それは君や俺を忙しくさせることだけど、主要な投資家はそんなこと気にしてない。コンプライアンスの費用や欠如は、貸借対照表の端数にもならないし、罰金や罰則なんて取るに足らない、笑っちゃうような額だ。何十年も毎年莫大な利益を上げてて、業界で許されてる統合の数を見れば、業界はほとんどやりたい放題だってことがわかるだろ。それが俺の言う「軽い規制」だよ。

manquer 2025/10/27 19:53:53

それは違法だろ。結局のところ、目標は合法的にやることだからな。
それに、すべての請求が同じじゃないってことも覚えておく必要がある。つまり、一部の請求は他の請求よりもはるかに高額になるってことだ。大量の摩擦を生み出すことで、似たような利益率の結果を達成できるんだ。例えば、事前の条件、複数の異議申し立てプロセス、事前承認のための事前承認、専門知識のない事務系の医師による審査(身元を明かす必要もない)なんかでね。
アメリカのシステムは最も極端というか、進んでるけど、特異なわけじゃない。民間保険のある国ならどこでも、もっと軽いバージョンでこれと同じ道を辿ってるんだ。
イギリスのNHSみたいな公的医療制度やドイツみたいな保険がうまく機能してるわけでもない。資金不足で管理もずさんで、専門医に診てもらうのに何か月もかかることもあるしね。
俺たちは毒を選ぶしかないんだよ。もちろん、金持ちなら話は別で、アメリカのシステムが断然最高だ。アメリカ以外の国からでも、ここでしか受けられないような治療を受けるためにアメリカに来る人もいるくらいだからな。

PatronBernard 2025/10/28 08:53:44

Pythonの知識がない人が、そのスクリプトが100%正しいってどうやって分かるんだ?「別に mission critical なことには使うな」とか「質的な分析に使える」とか言うかもしれないけど、絶対みんな何にでも使うって。ChatGPTが検索エンジンやセラピストとして使われてるのを見れば分かるだろ。

もっとコメントを表示(1)
extr 2025/10/27 21:15:23

ここでのコメントを見てると、社会がよく機能してるのが不思議だよな。みんな「何でも完璧、いつでも柔軟に対応」が基準だって思ってるのか?新しい技術が出るたびに endless に「 worthless でnever work」って言う人たちと働くなんて、どんなに楽しいことか。

davidpolberger 2025/10/27 19:43:51

Calcappの共同創設者なんだけど、Claude Codeを使って20個の新しいテンプレートを2日で作ってみたら、マジでぶっ飛んだよ。サンプルJSONファイルを見せただけで、ほとんどのアプリを一発で生成して、 competent で intricate なアプリを作るんだ。Excel関数の拡張(FILTERのlambdas、XMATCHのnamed sort type enumsとか)もすぐに理解したしね。
ある時、 verbose な formula を生成して、「CalcappがLETをサポートしてたらもっと prettier なのに」って言われたんだ。「実はしてるよ!拡張として、名前と値の区切りに , の代わりに := が使えるんだ!」って返したら、すぐに僕らの拡張 syntax を使って書き直して、 sleek な formula を作ったんだ。
これらのテンプレートは不動産、金融計画、小売といった色々な vertical 用で、Claudeの domain knowledge なしでは作るのは大変だったはず。しかも週末でできたんだ!まぁ、「僕ら」で週末にやったってことだけど。
だから、今回の開発は全然驚きじゃないね。ClaudeはExcelに right at home だろうし、Claude Codeが僕らのアプリデザイナーに permanent な home を見つけたらどんなに素晴らしいだろうって既に考えてるよ。でもコストが気になるから、今は様子見だけどね。僕がClaudeを使ってCalcappでアプリを作れるのに、お客様がその privilege を得られないのは unfair だなぁ。
(Claude Codeとの統合についてもっと読みたいならここへ: https://news.ycombinator.com/item?id=45662229)

causal 2025/10/27 18:24:59

みんな機能について speculate してるけど、TFAを読めばちゃんと書いてあるじゃん。features をリストアップするよ。
- どんなセルについても秒速で答えをゲットできる。
- 複雑なモデルも瞬時にナビゲート。特定の formulas や worksheets、tabs をまたぐ calculation flows についてもClaudeに聞ける。すべての explanation には cell-level の citations が含まれるから、 logic を verify できるよ。
- formulas を壊さずにシナリオテストができる。
- モデル全体の assumptions を更新しながら、すべての dependencies を維持できる。色々な scenarios を quick にテスト。Claudeは full transparency のためにすべての change を explanations 付きで highlight するよ。
- エラーの debug と fix ができる。
- #REF!、#VALUE!、circular reference errors の source を秒速で trace できる。Claudeは何が間違っていたのか、どうやって fix するのかを、モデルの残りを disrupt せずに explanation してくれるよ。
- モデル構築や既存テンプレートの filling ができる。
- 君の requirements に基づいて、 draft financial models を scratch から作成できる。あるいは、既存のテンプレートに fresh data を populate しながら、すべての formulas と structure を maintain できるよ。

Balgair 2025/10/27 20:25:28

もしこれが REF、VALUE、NA の問題に reliably に対処できるなら、それだけでも価値があるね。
ああ、あと1900年より前の date にも対応してくれたら最高。
Excelは自分の lane に留まってる限りは God からの gift だよ。でもちょっとでも逸脱したら、悪魔でさえ助けてくれない。
だけど、juuuuust maybe、AIならできるかも?

libraryatnight 2025/10/27 20:50:23

「悪魔でさえ助けてくれない。でも、AIなら?」ってさ。悪魔とAIが aligned してないって bold assumption だよね ;)

lavishlibra0810 2025/10/27 23:52:50

悪魔が仕掛けた greatest trick は、自分が存在しないと世界に convincing したことだね。

ACCount37 2025/10/28 02:33:26

いや、悪魔が仕掛けた greatest trick は、Machine Learning が legitimate な field of study で、ただの thinly veiled demon summoning じゃないと世界に convincing したことだろ。

globular-toast 2025/10/28 08:31:11

MS Word についても同じように感じるな。styles を consistently に使えば decent な document が作れるんだけど、みんな bold, italic, colours とかを絶対に触らないってことはしないし(styles を定義する時以外はね、デフォルトで十分なことも多いけど)。でも Word の appeal は、これを learning しなくても、やりたいことをやってくれるってことなんだと思う。AIは、やりたいことを実現しつつ、every time 正しい answers をくれる panacea になるのかな?

HPsquared 2025/10/29 08:37:54

WordとExcelはどちらも、low barrier to entry で、high skill ceiling だね。

beefnugs 2025/10/27 21:02:08

AIの不正確さに不満を持つのは技術屋だけだ。世間の多くの人は正確性なんかどうでもよくて、ただ上司に無能だと思われたくないだけだよ。

Yizahi 2025/10/27 22:59:39

世界のほぼ全企業が財務データとかプロセスにExcelを使ってるって冗談でしょ?いや、99.99%だね。財務データや在庫は超正確であるべきじゃないの?って思うんだけど。

fragmede 2025/10/28 02:58:11

実際どれくらい正確さが必要なの?工場にウィジェットが3個あっても、1日1000個使うならどっちみち生産は止まる。会社が1時間5,000ドルかかるなら、スプレッドシートの3ドルの誤差なんて大したことないだろ。誤差は累積するから調整は必要だけど、十分な方向性さえ合っていればOK。精度がタダじゃないなら、安上がりで「そこそこ」の仕事を選ぶのが普通だよ。

Yizahi 2025/10/28 09:42:52

2000ヘクタールの土地に撒く種やトラックの燃料、企業の課税には正確な数字が必要なんだ。君はLLMを擬人化してるよ。人間は小さな計算ミスをするけど、LLMはヒートマップとランダム化で文字を生成するから、桁違いの数字や全く違う情報を出すことがある。LLMは数字の意味を理解してないから、銀行口座番号でも平気で間違えるんだ。

fragmede 2025/10/28 10:11:12

2000ヘクタールの土地でも種は完璧には買えないし、多少の誤差は出る。燃料も蒸発するし、ミリリットル単位の誤差なんて気にならないだろ。1万トンの注文で1、2トンの誤差は1%未満でしょ?ある程度の精度で十分で、それ以上の精度は無駄な作業だよ。私がどこでLLMを擬人化したって言うんだ?私のコメントはLLM中立で、完璧な精度にはコストがかかるって言っただけだよ。

HPsquared 2025/10/29 08:40:06

スプレッドシートの小さなエラーって、最終的な結果にめちゃくちゃ大きな間違いを招くことがあるんだよね。特にスプレッドシートはエラーが隠れやすいから気をつけないと。

lionkor 2025/10/27 21:43:11

「ただの」精度好きの技術者たちのおかげで、僕らは今こうして快適にタイピングできてるんだよ。彼らは無駄どころか、世界のクールで便利な部分の多くを生み出してて、明確な価値を創造してるんだ。

Havoc 2025/10/27 19:27:36

試せるけど、誰も本気で導入はしないだろね。ChatGPTを財務の仕事に試したら、とんでもない量の幻覚(ハルシネーション)による間違いが出てきた。プログラミングと違ってエラーを教えてくれないから、LLMがやったこと全部を自分で確認しないと間違いに気づけない。サイレントに失敗するんだよ。金融システムに導入されたらヤバいだろうな。でも、スプレッドシートの簡単な定型作業なら使えるかもね。

AppleBananaPie 2025/10/27 20:42:19

スプレッドシート苦手なんだけど、LLMがデータとの接続方法やSQLクエリを教えてくれるから、データ収集がめちゃくちゃ楽になったよ。前は目視で済ませてたようなことも、今ではサクッとデータを取り込める。複雑な数式は使わないけど、データ取り込み方法を知りたいだけだから、僕みたいなユーザーにはすごく良い活用法だと思う。たぶん、僕の使い方はかなり定型的なんだろうけどね。

Havoc 2025/10/28 00:26:50

その使い方がうまくいくのはいいね。「複雑な数式は使わない」って点は僕も同じ。でも財務の仕事って、簡単な計算でも概念的に複雑になることがあるんだ。オフショア案件とか、通貨、管轄、会社が入り組んだスプレッドシートは、LLMには全体像が見えないみたい。ペンと紙で説明するようなニュアンスが伝わらないんだよね。

serf 2025/10/27 19:20:46

Anthropicって、俺にとっては変な状況だわ。急成長してて試したいプロジェクトもあるんだけど、Maxユーザーとしてのカスタマーサービスが酷すぎて、顧客を大事にするようになるまで利用しないって決めたんだ。周りの人もひどい話ばかりで、テクノロジストとして試したいのに残念だよ。

consumer451 2025/10/27 20:18:12

みんなのひどい話ばかりで、俺もテクノロジストとして残念だよ。
Claude CodeにIDEがないのは「1年以内にIDEは時代遅れになるから作るのが無駄」って考えてるかららしい。Noam ShazeerもDwarkeshのポッドキャストで「もうすぐロボットが掃除してくれるからガレージ掃除やめた」って言ってたし、彼らの信念のもとではIDEとか掃除、カスタマーサービスはすぐ廃れるどうでもいいものなんだろうね。

Thrymr 2025/10/27 21:49:44

Noam Shazeerが「もうすぐロボットがガレージ掃除してくれるからやめた」って言ってた件だけど、みんな家事をサボる言い訳はするけど、家族にはもっとそれらしいこと言わないとね。「明日世界の終わりだから、今夜は皿洗わない」って言うのと同じような反応されるんじゃない?

consumer451 2025/10/27 21:54:23

Noamの発言はAGIのタイムラインに関する質問への軽いジョークだったってことをはっきりさせておきたいんだ。彼はあまりインタビューを受けないから、俺のくだらないコメントで今後もっと話してくれなくなるのは嫌だな。彼からは学ぶことが多いし、彼が俺たちに何を与えてくれたかをみんなが理解してるかは分からないけど。

chairmansteve 2025/10/27 20:41:43

Noam Shazeerが「もうすぐロボットがガレージ掃除してくれるからやめた」って言ってたけど、そのロボット、1年後にいくらするんだろ?10万ドル?20万ドル?間違いなく一般向け価格じゃないよね。それなら今、1000ドル払って誰かに掃除してもらうこともできるじゃん。

consumer451 2025/10/27 20:56:40

彼みたいな天才のガレージに何があるか知りたくて、俺なら無料で掃除するよ。多分みんなと同じものだけど、それでも興味あるな。ポイントはガレージをキレイにすることじゃなくて、「いつAGIが実現すると思うか?」っていう質問への答えだったと思うよ。

y-curious 2025/10/28 12:08:53

信用してくれ、俺も彼と同じくらいの天才だよ。俺のガレージ掃除しない?来週暇?

consumer451 2025/11/03 02:46:34

もし西海岸にいるなら、11月18日から12月6日の間に空いてるよ。実際に行くし、録画や投稿もしない。username@gmail。面白そうだし、引き際もわかってる。無謀な賭けだって分かってるけど、ほら…チケット買っちゃったしね。

cmrdporcupine 2025/10/27 20:03:59

今、君たちは顧客じゃない。投資家が顧客なんだ。AnthropicのMaxサブスク料金じゃ、システム稼働のエネルギーやインフラコストを賄えてないだろうね。ハードウェアだけでも数万ドルかかる。だから今は大勢のユーザーを集めてモデルを証明し、人々を惹きつけ、ソフトウェア企業の経営層や人材にツールを導入させたいんだろう。そのうち価格を上げるか、Moore’s Lawを待つのか。Maxの料金にうんざりして、今はClaude CodeツールをDeepSeekのAPIにリダイレクトして使ってるよ。コストは1/4で、製品は3/4くらいだけど十分。モデルじゃなくてツール自体にどれだけインテリジェンスがあるか驚くね。DeepSeekとSonnet 4や4.5の出力の違いがほとんどわからない時もあるよ。

Wowfunhappy 2025/10/27 20:56:47

俺、OllamaでローカルLLMを試してるんだ。RTX 4080 SuperにRyzen 5950X、64GBメモリの結構いいPCだよ。主に120bのgpt-ossモデルを使ってるけど、ClaudeやGPT-5には劣るものの、とんでもなく差があるわけじゃないし、初期のChatGPTよりは明らかに良いね。テキスト生成はちょっと遅いけど、全然使えるレベルだよ。
だから、数年後にはコストがもっと下がるんじゃないかなって思うんだけど、どうかな?

cmrdporcupine 2025/10/28 16:44:44

可能性はあるかもね。AMD AI Max 395+みたいなシステムなら、かなり良いコーディングモデルをそこそこ速く動かせると聞くよ。でも、DeepSeek 3.2フルサイズはGPUメモリが足りなくて無理らしいね。
そんなシステムを組もうとしたら、2万~3万ドルくらいかかるんじゃないかな。しかも、それは basically 一人のお客さん向けのマシンでしょ。一方、Claude Code MaxとかCodex Proは月200ドルだよ。
これじゃあ、計算が合わないよね。もしローエンドのハードウェアでもモデルがまともに動くようになったら、 moat(堀)はなくなって、プロバイダがたくさん出てくるだろうね。だから、Anthropicみたいな会社の評価は俺にはよくわからないんだ。
俺は今、Claude CodeツールをDeepSeekのAPIと連携させて使ってるけど、Anthropicより全然安くて、品質も80%くらいは出てる気がするよ。

もっとコメントを表示(2)
Wowfunhappy 2025/10/28 21:52:56

DeepSeek 3.2モデルをフルサイズで実行できないのはGPU RAMが足りないからって話だけど、俺のRTX 4080はVRAMが16GBしかなくて、gpt-oss 120bはそれの4倍サイズなんだ。Ollamaはモデルの約80%をCPUで動かしてるみたいだよ。めちゃくちゃ遅くなるって聞いてたけど、俺のCPUだと全然そんなことないんだよね。
DeepSeekのフルサイズモデルを動かせないのはシステムメモリが足りないからで、これは比較的簡単に解決できるはずだよ。
ローエンドハードウェアでもモデルがまともに動くようになったら moat がなくなるって意見、これはいい指摘だし、もしかしたらそっちの方が大きな問題かもしれないね。

kridsdale1 2025/10/27 20:25:48

君の言う通りだね。
Google、Meta、Microsoft以外のAI企業は今、AGIの独占を期待して評価されてるけど、今のビジネスモデルはどれも黒字化すらしてないよ。続けて資金調達できるのは、唯一のプレイヤーになれるって期待に基づいているみたいだね。
オープンソースモデルの進化が続いているのを見ると、俺は独占なんて信じられないよ。
俺はもう賭ける場所を決めたから、安心してるよ。

informal007 2025/10/27 20:41:35

ひどい顧客サービスってのは、優先順位が低いから生まれるんだよ。
Anthropicは少数の顧客からのフィードバックよりも新しい成長ポイントを優先してるんだと思う。だから新製品や機能を頻繁に出してるんだ。彼らにとって注力すべき潜在的な機会が山ほどあるんだろうね。

empiko 2025/10/28 09:22:25

AI業界では同質化が進んでるよね。どんなミッションを掲げていようが、どのAI企業も今は儲かる何かを見つけようと、AIを使ったギミックを開発してる。投資家たちはひたすら待ってるって感じだね。

Yizahi 2025/10/27 23:03:17

B2C企業の顧客サービスは悪くなるか、現状維持のどっちかだよね。Google、Apple、Microsoftを見ればわかるよ。B2Bだと良くなる可能性もあるけど、それは10倍も大きい顧客が無理強いした場合だけだよ。

redhale 2025/10/27 20:18:59

何があったの?私はMaxの購読者だから、気を付けるべきことを知りたいな!

btown 2025/10/27 20:37:08

申し込みフォームにPrivate Equity \ Venture Capital、Hedge Fund、Investment Bankingって書いてあるのを見ると、これは明らかに金融モデリング向けだよね。めちゃくちゃクールだね。
以前、スタートアップでセルサイドの投資銀行員と一緒に働いた経験があるんだけど、彼らの仕事は、企業のバラバラな財務諸表から基礎となる仮定を理解し、3ステートメントモデルを作ったり、何度も作り直したりすることなんだ。それは標準的な慣習に則ってるだけでなく(https:\\www.wallstreetprep.com\knowledge\build-integrated-3-… が良い入門書かな)、季節性や感度、複雑な取引構造といった様々な仮定に合わせて高度にカスタマイズされるんだ。
シニアバンカーや顧客のアイデアに対応するため、何度も徹夜してモデルを修正するのはよくあることだよ!そして、あまりにも似たような数字が多すぎて、人間ですら「幻覚」を起こす可能性もあるのに、LLMならなおさらだよね。
でも基本的に、3ステートメントモデルとその全ての作成シートは、人間が読めるラベルがゆるくつながった依存関係グラフなんだ。つまり、LLMがその依存関係グラフを信頼性高く、意味のある形で巡回できるツールが作れるってこと。そうすれば、すごくクールなものを超高速で開発できるんだ。
俺は、中小企業がFortune 500企業が大量のバンカーを雇ってやるのと同じように、投資家に財務状況を提示できる能力を与えることは、健全な経済にとっても、メインストリートが成功し成長するための最高のチャンスを与えるためにも不可欠だと考えてるよ。これは正しい方向への massive な一歩だね。

JonChesterfield 2025/10/27 20:40:48

もっともらしいデータが生成できるツールを使って投資家向けに財務状況を提示するのは、詐欺行為だよ。

ceh123 2025/10/27 20:48:43

LLMがデータを生成しても、投資家への虚偽データ提供は詐欺だって。人間が作ったから詐欺じゃない、ってわけじゃないし、正確なデータなら生成方法関係なく詐欺じゃないよ。

alfalfasprout 2025/10/27 20:52:15

人間が意図的にそれっぽいデータを作るのは詐欺だけど、LLMがそうしても作った人が意図したわけじゃないかもね。でも、レビューしにくい不正確な予測とか資料が増えそうだよ。

ceh123 2025/10/28 01:06:42

LLMが嘘をつく能力があるからって、生成されたスライドが必ず詐欺とは限らないよ。会計士が確認すれば問題ない場合もあるし。でも、偶発的な詐欺は増えるだろうね。10k’sでのem-dashの使用頻度が気になるな。

lionkor 2025/10/27 21:44:53

「データの生成方法に関係ない」って言うけど、それって過去にそういう判例があったっけ?

ceh123 2025/10/28 00:56:56

1969年のUS v Simon判例によると、会計士は不正な財務諸表を認定したら責任があるんだって。LLMが生成した数字は特に念入りに確認しないとヤバいかもね。あくまで個人的な意見で、法律的な話じゃないけどさ。
https://scholarship.law.stjohns.edu/cgi/viewcontent.cgi?arti

lionkor 2025/10/28 07:21:11

へぇ、面白いね!リンクありがとう!

Kydlaw 2025/10/27 20:53:21

それってさ、たまたま会計って何かってことを説明しちゃったんじゃない?

btown 2025/10/27 21:26:48

今回話してるのはLLMが数式を生成するから、詐欺の議論はちょっと違うかもね。Excelモデルは元々監査できるし、AIで入力の数字をいじるのは前から可能だったんだ。結局は技術じゃなくて信頼の問題だよ。AIは真面目な人が早く仕事をするのに役立つはず。
https://www.youtube.com/watch?v=kOO31qFmi9A&t=61s

martinald 2025/10/27 16:51:12

これがもし期待通りに動けば、Excelで何十億ものプロセスを回してる多くの会社にとって超デカい話になるだろうね。新規作成より、既存シートの改善に役立ちそう。Claude Code並みに使えれば、Microsoftが追いつく前にガンガン導入されそうだな。

lm28469 2025/10/27 18:22:35

Excel担当のベテラン2人をクビにして、15年分のノウハウを捨てて、AIツールが数ヶ月でポンコツになったら泣くの?それが「大勝利」ってか?皮肉だよ。

brookst 2025/10/27 23:21:54

2人の社員が会社に欠かせないって状況、もし彼らがいなくなったら仕事全部ムダになるってこと?それってLLM導入を後押しする話じゃない?

lm28469 2025/10/28 09:52:47

2人の社員がいれば次の世代を育てられるだろ?人間がずっとやってきたことだ。数千キロも離れたとこのシステムに頼るなんてありえない。お前は産業をアジアに移すのも何も問題ないって思ってたタイプ?安ければいいってだけじゃん。

blitzar 2025/10/28 08:25:45

経営陣はさ、AIがなくても何十年もこの「天才的な」計画を実行してきたんだぜ。

bsenftner 2025/10/27 19:01:57

会社がちゃんとしてないと「2人の社員」はマジでいなくてはならない存在になるよ。Excelのことすごくよく知ってるし、Claudeと組み合わせたらもっと価値が出るはずだ。

Balgair 2025/10/27 20:29:34

うちの会社ではAIツールのおかげでやっとみんな仕事が進められるようになったんだ。締め切りも初めて守られてるかもね。2021年の過去の課題を追う代わりに、やっと会社が儲かるプロジェクトに取り掛かれるよ。バーンダウンチャートもいい感じだ。

thewebguyd 2025/10/27 16:56:00

「これがうまくいけばすごいことになる」って言うけど、Microsoftが競争阻害のためにファイル形式を変えて壊しちゃうまではね。だって、Copilot in Excelがやってることと同じだし。まあ、Copilot in Excelはまだゴミだから、なんでもそれよりはマシだけどさ。

JonChesterfield 2025/10/27 20:39:25

ビジネスの最重要Excelシートで欠けてたのは非決定論的な書き換えツールだよね。自動テストが皆無な業界でどうなるか楽しみだ。生成AIがスプレッドシートを変えられるのは間違いない。xlsxをテキストにして変更、戻す。うまくいかなきゃ捨てるだけ。ChatGTPがすごいって教え込んだから、Claudeも期待されちゃうよな。本当なら無謀な行為として重罰ものだけど、たぶん「天災」扱いされて終わりだろ。ITの世界じゃよくある話だ。

mattas 2025/10/27 17:11:49

LLMがスプレッドシートや数式を生成するってことにはそこまで期待してないな。でも、LLMが、何ヶ月もかけていろんな人が触った、大きくて複雑なスプレッドシートの中にある変な数式とかエラーを見つけるのには、かなり役立つんじゃないかなって思うんだ。

記事一覧へ

海外テックの反応まとめ
著者
海外テックの反応まとめ
暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。