メインコンテンツへスキップ

AIがゲノム理解を次のレベルへ AlphaGenome

·4 分
2025/06 AI ゲノム 遺伝学 機械学習 バイオテクノロジー

AIがゲノム理解を次のレベルへ AlphaGenome

引用元:https://news.ycombinator.com/item?id=44387659

RivieraKid 2025/06/26 20:56:58

細胞シミュレーション、特に分子動力学みたいに有用で、今のスパコンで実行できるようなブレークスルーがあるといいな。細胞の中が見えないのが、生物研究の一番の壁になってる気がするよ。

bglazer 2025/06/27 01:52:08

分子動力学って、ナノ秒とかオングストローム (.1nm) レベルのすごく小さくて短いダイナミクスを記述するものだよ。君が言ってるのは、 whole cell simulation に近い感じだね。細胞全体はタンパク質の何千倍も大きいし、細胞のプロセスは終わるのに何日もかかることがあるんだ。細胞には何百万もの個別のタンパク質が含まれてる。だから、個々のタンパク質を全部シミュレートするなんて無理で、計算コストが高すぎるし、たぶん永遠にそうだろうね。
問題は、生物学がスケールを跨いで信じられないほど tightly coupled してることなんだ。がんはその典型的な例。たった一つの細胞の DNA のたった一つの変異が、 blue whale を殺す腫瘍を引き起こすこともある。逆も然りで、食生活を変えるみたいな大きな変化が、 DNA への epigenetic な分子変化にまで funnel されていく。
基本的には、 whole cell みたいな大きなものをシミュレートする時は、少なくとも分子のディテールを考慮しないといけないんだ。 machine learning ツールと十分なデータがあれば、いくつかの common pattern を学べるけど、 physical なモデルも machine learned なモデルも、面白い emergent behavior を smoothing over してしまうんじゃないかなと思うね。
細胞の中が”見えない”ってことについては、君の言う通りだよ。でも、モデルってのはデータが見せるところまでしか実際には見られないんだ。だから、アルゴリズムや GPU を良くするのと同じくらい(かそれ以上に)、より良い顕微鏡や sequencing 方法が、より良いモデルを drive していくと思うよ。

fainpul 2025/06/27 06:22:50

” A single mutated letter in DNA in a single cell can cause a tumor that kills a blue whale. ”
サイドノート:クジラって、がんにかかることがほとんどないんだよね。 Peto’s paradox って言うんだ。
https://en.wikipedia.org/wiki/Peto%27s_paradox
https://www.youtube.com/watch?v=1AElONvi9WQ

cysteinechapel 2025/06/30 22:38:35

スケールは互いに decoupling することもあるよ。 whole genome レベルの複雑な形質の遺伝的 variation は、個々の遺伝子や variant が明らかに non-linear な epistatic な相互作用を持ってるにもかかわらず、主に additive な形で働くんだ。

mbeavitt 2025/06/27 10:16:13

現実世界をどんどん正確なスケールでシミュレートしても、そんなに役に立たないんだ。だって生物学では、他のどんな分野よりも、私たちの仮定がほとんどの場合 incorrect / flawed だからね。シミュレーションで一番役に立つのは、それらの仮定を直接テストすることだよ。そして、そういうケースでは、モデルはシンプルなほど良いんだ。 Jeremy Gunawardena がこれについて素晴らしい記事を書いてるから、読んでみて: https://bmcbiol.biomedcentral.com/articles/10.1186/1741-7007

cysteinechapel 2025/06/30 22:47:41

基になる詳細をモデル化しない biology のシンプルなモデルでも、スケールを超えて profoundly generalizable な洞察を与えてくれるものはたくさんあるよ。 Percolation threshold model なんかは、 savannna-forest transition から complement immune system 、 epidemics 、 morphogenesis 、 social networks に至るまで、 phase transition behavior を説明できるんだ。

kylehotchkiss 2025/06/27 16:33:57

そして、これらの仮定を確認/否定する、ものすごく難しくて、お金がかかって、そしてしばしば結果が出ないプロセスこそ、税金や大学の学位の最大の使い道の一つだと思うんだ。なのに、今の administration はそれを Miasma と見なしてる。しかも EPA をカットしたんだよ。彼らの論理なら、それは Miasma を止めることになるはずなのにね。

andrewchoi 2025/06/26 22:12:01

Arc の人たちが、これを構築しようとしてるみたいだよ!見てみて: https://arcinstitute.org/news/virtual-cell-model-state

dekhn 2025/06/26 22:58:51

STATE は simulation じゃないよ。それは perturbation の結果として property prediction をする、訓練済みの graphical model なんだ。細胞の物理モデルはないよ。個人的には、 arc のアプローチの方が reasonable な時間で usable な科学的成果を生む可能性が高いと思うな。 very coarse なモデルじゃないと reasonable な量の sampling ができないし、 care してないことの計算に huge な時間を費やすことになるだろう。 An embedding と graphical model は、 underlying data が representative で comprehensive である限り、こういう問題によく suited してるみたいだね。

ahns 2025/06/27 02:43:08

トップダウンの experimental な視点から、これを楽しめるかもね( https://www.nikonsmallworld.com/galleries/small-world-in-mot… )。まだ intracellular dynamics を見せるエントリは few だけど( like this one: https://www.nikonsmallworld.com/galleries/2024-small-world-i… )、 some groups が capture できた dynamics の wide variety はいつも enjoy してるよ。 nervous system development とか( https://www.nikonsmallworld.com/galleries/2018-small-world-i… )は、 absolutely incredible だね。

kylehotchkiss 2025/06/27 16:32:22

まだ正確に分かってないことを、どうやってシミュレーションするの?もう、AIの「思想的リーダー」たちがこれを万能薬みたいに言っててマジうざいんだけど。特にモデル学習に必要な研究費のほとんどが、イーロンがロケットに金使うためにバッサリ削られたのにね。

t_serpico 2025/06/27 00:50:18

細胞とか組織とか臓器とか、生物全体の「中を見る」のが、今のほとんどの生物学研究だよね。

tim333 2025/06/27 10:22:53

DeepMindの主要な目標なんだって。もし成功したらすごく役立つだろうから、期待してるよ。

RivieraKid 2025/06/27 17:43:18

これって細胞のすごく荒いシミュレーションみたいだね。ちゃんとした分子動力学シミュレーションの役立ち方には全然及ばない気がするんだけど、合ってる?

eleveriven 2025/06/27 07:06:14

なんか足りないのは、細胞レベルのダイナミクスを「早送り」するボタンみたいなものって感じだね。

m3kw9 2025/06/26 21:23:39

これは量子コンピューティングが関わってくるところだと思うけど、10年くらい先かもね。でもAIの進化は予測しづらいけどさ。

j7ake 2025/06/27 03:08:26

なんでシミュレーションするの?もう実験でできるじゃん。

mnw21cam 2025/06/27 13:28:09

私の分野では、ヒトの膵臓β細胞でDNAが変わったらどうなるか、いつも知りたいんだ。ヒト幹細胞からヒト膵臓β細胞っぽいものを作るプロトコルはあるけど、特定のDNA変化に対して、それが本物の細胞みたいに振る舞うか正直よく分かんないんだよね。明らかに同じように振る舞わない例もあるし。

tim333 2025/06/27 10:21:36

ほとんどの場合、AIのブラックボックスで何が起こってるか見えないよね。

noduerme 2025/06/26 22:33:32

ハルシネーションして説明できないブラックボックスじゃなく、真の決定論的なシミュレーションを作ることに、もっと興味持ってほしいな。

Kalanos 2025/06/27 13:52:20

”ノンコーディング”なバリアントの機能予測はすごい。ダークゲノムとも呼ばれるノンコーディング領域は制御性ncRNAを作り遺伝子発現レベルを決めるんだ。遺伝子より制御性RNAが多く、発現量の約75%がncRNAだよ。

dekhn 2025/06/27 19:31:04

ゲノムの”ノンコーディング”部分で”機能的”って意味が長年の議論なんだ。深く知るほどゲノミクスと進化の理解に自信がなくなったよ。一つの見解はこれ見て: https://www.sciencedirect.com/science/article/pii/S096098221

wespiser_2018 2025/06/27 14:30:11

ncRNAの”機能的”側面は、ラボより長い時間スケールかも。”ジャンクDNA/RNA”仮説みたい。ncRNAは稀なイベントで適応度を上げる。進化時間で見れば有利だけど、”ある一点”視点では難しい。10年前に研究で学んだこと。ENCODEも役立ったけど”機能的”証拠はない。同じアプローチは役に立つか懐疑的。間違ってたら嬉しいけどね。

cysteinechapel 2025/06/30 23:07:05

そんな稀で長い時間スケールな有利さは実質中立になっちゃう。自然選択が作用できるのは、実効集団サイズの逆数より大きい有利さだけ。ほとんどはノイズ。例えばトランスポゾンは便利だからじゃなく残ってる。抑制メカニズムも常には機能しない。軍拡競争。たまに有利な変異を提供することはある。

richardvc 2025/07/01 13:10:15

ゲノム理解は動くパズルみたいだった。AlphaGenomeは変えてる。複雑な遺伝子データ解釈に焦点。僕のラボでは精度が全てで、DNA定量にUV分光光度計をすごく頼りにしてた。https://www.berthold.com/en/ のシステムは厳し条件下でも優れてた。精度が重要なプロセスを効率化。1949年設立、信頼できる測定技術の基準。ツール選びは機能だけでなく、長期的な信頼性と結果の明確さにかかってるんだ。

xipho 2025/06/27 03:20:29

”一貫したデータ解釈を保証し〜確立されたオントロジーを使ってメタデータを標準化した。”
DNAで物事を機能させるには人間によるデータキュレーションが必要。初日からアライメントモデルは生物学的観察。UBERONが重要な役割果たしてるの嬉しい。膨大な人間的洞察とデータキュレーションを表してるんだ。

jebarker 2025/06/26 19:14:38

DMだけが高インパクトなAI応用研究やってるとは思わないけど、この分野では実力以上を出してるように見える。なんで?技術マーケティングがうまいだけ?

331c8c71 2025/06/26 19:30:04

これはよくできた研究みたいだけど、決して革命的じゃないね。みんな似たようなことは前からやってるよ…

Gethsemane 2025/06/26 20:48:41

最近AgroNTみたいな面白い進展に同意!ゲノム解析がどんどん安くなるから超期待してるよ。この記事の論文はアプローチの確かな証明だと思うし、RosettaFold\AlphaFoldみたいにすごい速さで発展するだろうね!

tim333 2025/06/26 21:47:54

彼らはGoogleのおかげで長いことやってて、リソースもたんまりあるみたい。Perplexityによると、AlphaFold 2のデータベース構築には”数百万GPU時間”かかったってさ。

もっとコメントを表示(1)
kridsdale3 2025/06/26 22:00:00

これはDemis氏のすごく興味ある分野なんだよ。

forgotpwagain 2025/06/27 03:53:06

DeepMindとかGoogleは、みんながまず考えるAmazonとかMetaよりすごいこといっぱいやってるんだ。
でもPharmaやbiotech、大学でも同規模の素晴らしい研究がたくさんあるよ(見えにくいけど)。NVIDIAは自社技術を使わせようとパートナーになる。
Arc InstituteのEvo2ってDNA Foundation Modelはすごいし、AlphaFold 3と同等の構造モデルもオープンウェイトで複数あるんだ。

daveguy 2025/06/26 22:04:45

まあ、彼らはGoogleの組織だからね。
2兆ドルの会社にバックアップされてるってのは、マーケティングだけじゃないメリットがあるってことさ。

jebarker 2025/06/26 22:41:16

お金とリソースだけが理由じゃないと思うな。
もっと価値のある会社だってあるけど、これほど応用AIで成功してるわけじゃないんだから。

sidibe 2025/06/27 02:33:35

価値的にはもっと上の会社はあるけど、リソース面でGoogleよりすごい会社はないよ。
Appleでさえ、Googleみたいなインフラを全部作ろうとしたら何年もかかるだろうね。

eleveriven 2025/06/27 07:07:16

他のラボも間違いなく素晴らしい仕事をしてるんだけど、たいていはもっとニッチだったり、あまり一般に公開されてなかったりするんだよね。

nextos 2025/06/26 20:21:13

生物学の分野だと、Arc Instituteが斬新ですごいことをやってるね。
GenentechとかGSKみたいな製薬会社にも、すごく優秀なAIチームがあるんだよ。

331c8c71 2025/06/26 20:47:51

そういえば、Arcは最近perturbation modelをリリースしたんだって。
もし claimed(主張されてる)通りにlinear benchmarksを確実に超えるなら、これは大きな一歩だね。
https://arcinstitute.org/news/virtual-cell-model-state

seydor 2025/06/26 18:12:58

この問題、めっちゃ面白いね。ヒトゲノムの3.2Gbpまで入力サイズを広げたら、これまで想像もできなかった相互作用が見られるかも?あと、最近何でもU-netsとtransformersばっかりなの興味深いなー。

pfisherman 2025/06/27 00:07:40

ゲノム全部は要らないと思うな。2 megabasesで十分かも。ゲノムって一つながりじゃなくて、染色体とかtopologically associated domainsっていう領域に分かれて物理的に整理されてるんだ。cis regulatory elementsとかeffector genesの相互作用も、確か2 megabasesくらいが3 sd thresholdだったはずだよ。

teaearlgraycold 2025/06/26 18:27:37

> あと、最近何でもU-netsとtransformersばっかりなの興味深いなー
トンカチを持ってる男には…ってやつだね。

TeMPOraL 2025/06/26 23:55:04

トンカチ男っていうか、wheelとかmagnets、copper wireを持ってる男の話かな…。分野横断的に広く使えるtechnologyってあるんだよ。Heat enginesとかElectricity、Liquid fuels、Gears、Glass、Plastics、Digital computers。そしてもちろん、transformersもね。

SV_BubbleTime 2025/06/26 18:59:13

もうすぐゲノム全部をblockchainに乗せられるようになるぞ。(/sって書かなくても分かると思ったんだけど)

eleveriven 2025/06/27 07:08:57

Even just modeling 3D genome organizationとかultra-long-range enhancersをもっと現実的にモデル化するだけでも、新しいinsightsがあるかもね。

kylehotchkiss 2025/06/27 16:21:32

私はsomewhat a noobなんだけど、このmodelってOvRFsとかmethylationみたいなのをちゃんと理解できるの?それともstrictly a sequence pattern matching thingyなの?

another_twist 2025/06/27 08:58:00

So very similar approach to Conformer - convolution head for downsampling and transformer for time dependencies. Hmm, surprising that this idea works across application domains.

insane_dreamer 2025/06/27 15:26:23

These are the type of advances in AI models that I’m excited about because of their potentially beneficial high impact for mankind. Not models that are a better (but less reliable) search engine or coding assistant and email writer. I wish more effort/money was going into this.

mountainriver 2025/06/26 18:28:23

With the huge jump in RNA prediction seems like it could be a boon for the wave of mRNA labs

eleveriven 2025/06/27 07:03:34

みんながもっと小さくて専門的なデータセットでファインチューニングし始めたら、どうなるか興味あるね。

dekhn 2025/06/26 16:56:58

2008年にGoogleで働き始めた時、生命科学に投資すべきだって主張したんだ。データ処理とMLの能力で世界をリードできると思ったから。exacycleでタンパク質とか色々やったし、Google Cloud Genomicsも立ち上げたよ。Googleは辞めたけど、DeepMindが僕の目標をずっと良く達成してるのを見るのは嬉しいね。Sundarはあまり inspiring なリーダーじゃないけどさ。この最新の論文はすごく複雑で、コミュニティが理解するには時間がかかると思う。

deepdarkforest 2025/06/26 18:23:30

Sundarがあまり inspiring じゃなかったってのは分かるけど、彼はGoogleをすごい収益マシンにしたんだよ。利益は10倍になったし、この規模での成長は前代未聞だよ。Sam AltmanやTim Cookみたいな派手さはないけど、結果を出してる。AIへの移行は遅れたけど、Geminiもすごく競争力があるしね。DeepMindも素晴らしい仕事をしてる。彼は過小評価されてると思うな。

modeless 2025/06/26 18:35:11

Ballmerみたいに、彼(Sundar)も前任者に成功を用意してもらってたんだよ。既存ビジネスの強い成長は邪魔しなかったけど、他のところではかなり失敗してる。問題は、GoogleにとってのSatya Nadellaは誰かってことだよ。Demisかな?

bitpush 2025/06/26 18:43:34

Microsoftの話が出たから言うけど、Satya Nadellaは素晴らしい仕事をしたってのは同意するよ。客観的に見て彼の功績は何かって?たった一言、Azureだよ。AzureはAWSに次ぐ2位だけど、それだけ。Microsoftの「雰囲気」は変わったけど、全くイノベーションしてない。OpenAIとの提携で天才みたいに見えたけど、Microsoftには戦略がないのはますます明らかになってる。Github CopilotもMS Copilotも誰も使ってない(ひどいジョークだよ)。基盤モデルもないし、消費者向け製品もない。Bingも相変わらずBingだし、マーケットシェアもほとんど増えてない。

CuriouslyC 2025/06/26 18:36:34

彼はGoogleの製品を「en\shittifying」(クソ化)することで収益を上げたんだよ。Geminiが追いついてるのは、Demisが最高だからだし、TPUが本当の競争力なんだ。

bitpush 2025/06/26 18:44:57

CEOの手柄と失敗はセットで考えるべき。Gemini成功が彼の手柄なら、悪い状況(enshittification)も彼のせいだよ。

com2kid 2025/06/26 21:22:24

90年代のMicrosoftはマジ天才だった!
「全家庭にPC」のミッション、全国規模のトレーニング、学校でのプログラミング教育、神ドキュメントとデモアプリ、ネットがない時代のCD配布、専門書、超丁寧なテスト、価格競争圧力、オンラインゲームやタブレットなど次々イノベーション…今のチームよりずっと少数でこれ全部やったんだぜ!

agumonkey 2025/06/26 18:42:47

Googleのブランド、特に検索はもう終わったかも。AI中心に変わるかもしれないけど、「Google」って名前はもう色褪せちゃったな。

jama211 2025/06/26 19:04:43

でも、自分の意見を通したいからって、どれがCEOの手柄でどれがそうじゃないかって、テキトーに選んじゃダメだろ。

oceanplexian 2025/06/26 19:02:39

Geminiが”超競争力がある”って?
750億ドルも使って、Anthropicとか中国のスタートアップと同レベルの「中の下」みたいなモデルができただけなら、”競争力がある”ってのはずいぶん甘い言い方だね。

spongebobstoes 2025/06/26 18:32:08

曖昧さなんてなくせないよ。読み手が書き手の言いたいことを一番強く汲み取ろうと努力すべきなんだ。

もっとコメントを表示(2)
modeless 2025/06/26 18:46:54

SatyaになってからMicrosoftはオープンソースに超優しくなったよね。VSCodeとかGitHubとかWSLとか、Ballmer時代じゃ絶対無理だったと思う。プラットフォーム囲い込みじゃなくて、開発者のためにって方針変えたのはマジすごい功績だよ。

modeless 2025/06/26 21:47:50

> Windows CEカーネルチームは10人以下だった!
そりゃそうだろ。CEはダメダメで、Windows Phone失敗のデカい原因だったと思うわ。そこからの移行に手間取って、アプリ作る環境がずーっと微妙だったんだよね。当時Microsoftにいて、Silverlightもちょっとやってたよ。

radialstub 2025/06/26 19:46:57

> AzureがAWSに次ぐ2位なのはSatyaの戦略のおかげ
これは違うと思うな。Azureが2位なのは、MSがビジネスソフトで圧倒的だからだよ。クラウドはそのビジネスの自然な流れじゃん。まともなもん作りゃ客は勝手に来たって。

bitpush 2025/06/26 19:29:56

自分で書いたの読み直してみてよ。「CEOのおかげだったり、CEOなのにそうだったり」とか、マジ適当すぎ「willy nilly」じゃん。「en~化」はCEOのせい(なんで?CFOかも?)、GeminiはDemisのおかげ(なんで?CEOかも?)とか、適当に決めつけすぎだって。

bitpush 2025/06/26 19:28:17

> MSはSatyaでオープンソースに友好的に
それはホントだけど、数少ない影響力あるプロジェクトだけじゃん。他社もすごいOSSやってるし。方針転換大変なのはわかるけど、正直どの巨大テックが未来に真に革新してる?AppleはVision Proだけ。AmazonはAWS頼み。MSはAI初期リードをフイに。GoogleはGemini、Waymo…。SatyaはGoogleのトップより注目されてると思う。

shadowgovt 2025/06/26 19:07:43

それは読者に期待しすぎだよ…。でもこのフォーラム(https://news.ycombinator.com/newsguidelines.html)では、まさにそれがルールなんだ。「相手の言葉を最も良い意味で解釈して返信して。批判しやすいように曲げないで。善意で受け取ろう。」ってね。

com2kid 2025/06/27 02:22:17

Windows Phone 7のカーネルはマジ最高だったよ。古いカーネルから全部書き直して、パフォーマンスもリソース効率も電力消費も神がかってた。俺的には、MSの携帯事業失敗は、Windowsカーネルに移って要求スペックが倍になったのが原因だと思う。

modeless 2025/06/26 19:57:01

Googleだってデータセンターとかクラウドの技術すごいんだから、クラウドは自然な流れって言えるはずだけど、Googleはまだ遅れてるよね。やっぱMSのAzure成功はSatyaの手腕だよ、絶対。

bitpush 2025/06/26 18:46:46

世の中ってHN(Hacker News)のバブルよりずーっと広いんだよ。去年はみんなMSが何でもわかってるみたいに思ってたけど、今どうよ。10億ドルってめーっちゃデカい数字で、それがどれだけすごいかピンとこないことあるよね。

deodorel 2025/06/26 20:58:10

彼は収益をたくさん伸ばしたかもね。でも、Googleの文化はほぼ消えた。社内ではAmazonみたいなパフォーマンス管理に近くなってきたよ。

tiahura 2025/06/26 19:01:15

将来のAIセンターになるかもね。
HNのヘッドライン見てないの?Googleの重要な高品質AIリリース量は驚くほどだよ。
それに、最高のデータを持ってるし。

echelon 2025/06/26 20:06:47

>GoogleのSatya Nadellaは誰?Demis?
100%Demisだよ。
Demis対Satyaって構図はすごいことになりそう。

leoh 2025/06/27 02:35:05

イントロンを解明しようぜ、頼む!

qoez 2025/06/27 16:40:22

Demisが史上初のノーベル賞4連続受賞者になるぜ。

nextos 2025/06/26 17:00:47

この分野の大きな問題、つまり相関性の高いDNA領域での原因となるバリアントとそうでないものを区別すること(遺伝学用語でファインマッピング)を無視してるのが残念だったな。次バージョンに期待するけど、重要な制御領域を標的とする効果的な薬剤設計には本当に大事なんだ。この問題の興味深い例とその解決がなぜ重要かについては、最近Natureに発表されてて、自己免疫疾患におけるマクロファージ機能調整の面白い薬剤候補につながってるよ: https://www.nature.com/articles/s41586-024-07501-1

rattlesnakedave 2025/06/26 17:13:58

これで一歩近づいた?よく分かってないけど、より良い機能予測ができれば、本当に重要なバリアントとそうでないものを見分けやすくなる気がするな。たぶん次のステップはこれを適切な統計的ファインマッピング手法と統合すること?

nextos 2025/06/26 17:39:40

ええ、でも既存のものと劇的に違うわけじゃない。
予測と因果性の間には憂慮すべきギャップがあるんだ。今回の問題みたいに多数の変数が強く相関してる場合、因果性を暗黙的にしか考慮しない予測手法はうまく機能しない。
今、SOTAはゲノム内の各連鎖ブロック内で因果性を推測するために大規模な集団データを使うみたいだね。こういう手法はPearlの因果グラフの概念にかなり近いよ。

記事一覧へ

海外テックの反応まとめ
著者
海外テックの反応まとめ
暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。