Cloudflareがまさかの停止！

Cloudflareがまさかの停止！

引用元：https://news.ycombinator.com/item?id=44261064

datadrivenangel 2025/06/12 18:24:01

Cloudflare公式ブログのリンクだよ。今回の件についての詳細が載ってるよ。
https://blog.cloudflare.com/cloudflare-service-outage-june-1…

claudex 2025/06/12 20:05:06

記事からの引用ね。”Cloudflareの重要なWorkers KVサービスが、主要な依存関係であるサードパーティサービスの停止によりオフラインになった”んだって。
つまり、彼らは一部サービスで GCP に依存してるってことかな。

its-kostya 2025/06/12 21:41:08

もしそれが本当なら、BGP周りの他のいざこざがなければ、その依存関係はすぐなくなるんじゃない？

yencabulator 2025/06/13 02:35:46

記事からの引用だよ。”Workers KV は、中央ストアのためのはるかに回復力の高いインフラに移行中なんだ。残念ながら、今回はその移行の隙間を突かれちゃったんだね”ってさ。

beastman82 2025/06/12 21:54:51

俺の WAG （てきとーな推測）だと、Workers KVって会社全体のインフラの95％くらいを占めてるんじゃないかな。

IX-103 2025/06/12 23:12:47

mandatory dependency で、insider risk を軽減するための”必須の依存関係”だって聞いたよ。だから、まずなくならないね。たぶん、”問題点を早期に発見するため”とか言って、さらに遅いロールアウトを強制するようになるんじゃない？

pizzafeelsright 2025/06/12 22:45:59

CEO が”すぐになくす”って言ってたよ。

asteroidburger 2025/06/12 21:48:36

Sub-processor ページって、そういうの確認するのに簡単だよ。Cloudflare のサービス向け Sub-processor ページはこれ。
https://www.cloudflare.com/gdpr/subprocessors/cloudflare-ser…

reimertz 2025/06/12 20:10:56

似たようなこと書いたわ。今後のためになったぜ。

voxadam 2025/06/12 23:01:41

ってことは、一部のサービスでGCP使ってんの？
Googleは停止なんてしてないって言ってるぜ。ホラここ↓
https://x.com/Google/status/1933246051512644069
https://nitter.net/Google/status/1933246051512644069

IX-103 2025/06/12 23:09:53

そう言いたい気持ちはわかるけど、顧客ならみんな嘘だって知ってるよな。

hinkley 2025/06/13 01:26:35

これっていつもの”顧客の3%にとっては100％ダウン”ってやつ？

yencabulator 2025/06/13 02:36:37

Google Cloudのステータス見ろよ↓
https://status.cloud.google.com/incidents/ow5i3PPK96RduMcb1S…

mirashii 2025/06/13 01:43:52

まじかよ、停止してたって明確に書いてある公式ダッシュボードじゃなくて、4時間も前のツイートなんかリンクしてんのかよ。

voytec 2025/06/13 01:17:06

SLAとかSLOの支払いから逃げようとしてんだろ。

koliber 2025/06/12 19:07:39

Downdetector見ると、GoogleとかCloudflare、AWSとか大手で軒並み停止してるぞ。
噂じゃあ、これ全部BGPルーティングの問題らしいな。

cogman10 2025/06/12 19:13:04

確かにありそうだな。前にこういうの見かけた時、BGPが原因でトラフィックがイランとか中国経由になったことあった気がする。

nijave 2025/06/12 19:28:36

そういやもっと前の中国関連の事例もあったな。これ↓
https://www.cyberdefensemagazine.com/experts-detailed-how-ch…

koliber 2025/06/12 19:16:39

なんか昔似た件あったっけなー。でも今回はこんなにいっぱいサービスに影響した感じじゃなかったかも。てかさ、個人的には何もダウンしてるの気づいてないんだよね。俺ヨーロッパにいるけど。

cogman10 2025/06/12 19:23:37

これがその件ね [1]。なんか単一の /24 を狙ったみたい。だからそんなに大事にならなかったのかもね。[1] https://bishopfox.com/blog/bgp-hijacking-technical-post-mort…

Animats 2025/06/12 20:03:42

「Internet Health Report」ってとこがさ、「表示するデータなし」って言ってるよ。[1] https://www.ihr.live/

ramesh31 2025/06/12 19:16:32

Anthropic もダウンしてるか、なんか調子悪いっぽい。もう散歩行こうかな。

jerrygoyal 2025/06/12 18:49:42

GCP もダウンしてるってさ。 https://news.ycombinator.com/item?id=44260810

ipsum2 2025/06/12 18:56:33

変な偶然だねー。CloudflareってGCP使ってんのかな？

ikiris 2025/06/12 19:00:43

Googleの停止状況見る感じだと、たぶん認証のインフラが原因っぽいよ。

devmor 2025/06/12 19:05:42

これってどういう意味？Googleの停止ってほとんどのGCPサービスに影響する広範囲な停止のことだけど。

pageandrew 2025/06/12 19:08:12

Googleは原因が一部の中心的IAMサービスにあるって言ってるよ。それが他のサービスにカスケード影響してるんだって。

devmor 2025/06/12 19:11:53

その情報どこで見たの？SNSかな？
インシデントレポートの影響サービスリストにIAMサービスがあるのは確かに見たよ。

tom1337 2025/06/12 19:13:12

ここ見て。
https://status.cloud.google.com/incidents/ow5i3PPK96RduMcb1S…
Identity and Access Management Service Issueのせいで複数のGCP製品が影響受けてるって書いてある。

ikiris 2025/06/12 20:31:42

上を見てごらんよ。このHNコメント欄の上のほうに高評価されて載ってるじゃん。

もっとコメントを表示（1）

devmor 2025/06/13 06:50:04

俺がその返信を投稿した時にはまだそうじゃなかったんだよ。お前が俺の投稿に返信してるのって、俺が投稿してから2時間後だし。

ikiris 2025/06/12 20:33:17

そのコメントは自分で意味がわかるものだったし、いや、広範囲なGCP停止じゃなかったんだ。GCSとfirebase以外はほとんど動いてたし、その後でIdentity関連がカスケード問題を引き起こし始めたけど、このコメントが投稿された時点ではそうじゃなかった。

zerd 2025/06/12 21:08:33

＞広範囲なGCP停止じゃなかった
これが広範囲じゃないなら何が広範囲なんだよ？
API Gateway, …, Vertex AI Search
これだけのサービスが影響受けてるインシデントだぞ。

ikiris 2025/06/13 00:09:19

うちのGCPのインフラ全体は全然大丈夫だったよ、ただ何も管理できなかっただけだけど。なんて言えばいいか分かんないや。お前がリストアップしたものの多くは全然止まってなかったし。

mirashii 2025/06/13 01:46:22

お前んとこで止まってなかったからってみんなが大丈夫だったわけじゃないんだよ、ほとんどみんながダメだった可能性もある。
Googleも誰も影響受けてないならサービスを停止リストに入れないはずだろ。
「俺には動いてた」から「みんなに動いてたはず」って決めつけちゃダメだよ。

ikiris 2025/06/13 04:36:53

元SREとして、この手の仕組みはよく知ってる。記事に挙げられてるようなのが本当に広範囲で止まってたら、もっとずっとひどかったはずだ。

solardev 2025/06/13 09:35:42

言ってること意味わかんないんだけど？ GCP自身のステータスページでも障害って書いてたじゃん？うちの上流のプロバイダー（GCP使ってる）は確かに影響受けてたし止まってたよ。
元SREとして、「広範囲な障害」ってのは、一般人にはステータスページ見てもわからない特別な分類なの？それともどういう意味？

iimblack 2025/06/13 01:49:39

Google自身がこれを障害としてリストアップしてるのに、議論するってすごい変だね。

artursapek 2025/06/12 22:54:26

向こうのKVストアは確実に止まってたね。

neo_doom 2025/06/12 18:57:25

うん、これは問題になるね。こんなに多くのサービスにわたって広範囲な問題は久しぶりに見たよ。

tete 2025/06/12 19:48:30

みんなが一握りの場所に全部集めるせいで、今はこれが半ば定期的になってるみたいだね。

solardev 2025/06/13 09:38:27

言わせてもらうと、こういうこと起こるの、ちょっといいんだよね…プロバイダーから顧客まで、みんな仕事がなんか一時停止する。
なんか国民の休日みたいに感じて、影響受けてるクラウドの下流にいる人たちは、何もできないからただ座ってリラックスできるんだよ。
自分のところで障害が起きたら、全員出動パニックモードだけど、ネットの半分が止まってるなら、もう自分の問題じゃないって感じ、笑

prauscher 2025/06/13 13:48:18

どのくらいのダウンタイムが許容されるかは、会社次第だね。Cloudflareみたいに（うまく対応してた）なら、これをサードパーティプロバイダーに対するフォールトトレランスを構築するきっかけにする。
もし君のアプリがミッションクリティカルなら、ダウンタイムは休日どころじゃない。

paxys 2025/06/12 18:55:35

当ててみようか、誰かが悪いBGP設定をデプロイしたんだろ？

CSMastermind 2025/06/12 19:20:51

この規模で広範囲な障害なら、それが主犯であるはずだね。

tete 2025/06/12 19:44:45

「ネットをどう救ったか」って大げさなブログ記事がきっとすぐ出るよ😉
今は落ちてるけど、参考までにこの記事を見てね: https://blog.cloudflare.com/the-ddos-that-almost-broke-the-i…

aranchelk 2025/06/12 18:26:48

「あなたが人間か確認します」ってダイアログとWorkers機能にも影響出てるみたいだよ。

clairegraham 2025/06/12 18:32:02

うん、KVもダメだね。KVに依存してるWorkersは全部エラー出てるよ。ダッシュボードには入れたけど、めちゃ遅い。UTC 18:00頃からエラー率がかなり上がったみたい。
追記: CFのステータスページでも多くのサービスで広範囲な障害だって認めたよ: https://www.cloudflarestatus.com/incidents/25r9t0vz99rp

aranchelk 2025/06/12 18:35:11

何度か試したら俺もダッシュボードに入れたけど、使い物にならないね。エラーポップアップがずっと出てるよ。

bgwalter 2025/06/12 19:20:22

そうなんだ。でも、なんでいつもCloudflareからこういうダイアログが出るのに、Akamaiからは全然出ないんだろうね？

bgwalter 2025/06/12 19:29:05

このコメントを低評価したり投稿を報告したりしても、この深刻な問題は解決しないよ。この認証ダイアログのせいでインターネットが使えなくなるんだ。

bgwalter 2025/06/12 20:00:29

apnews.comのスレッドで文句言ったんだ。apnews.comの認証自体もウザいのに、今回は全く動かなかったからさ。それは全然関係なくないでしょ。

pier25 2025/06/12 18:51:40

タイトルが「広範囲なCloudflareサービス停止」に変わったよ。

ourmandave 2025/06/12 19:04:45

東京で18:00 UTCから予定メンテしてて、問題が18:19 UTCに始まったって偶然？

alexcroox 2025/06/12 19:54:06

関係ないよ。CloudflareにはダウンしてるGCPに依存してるサービスがあるから。でも、東京でメンテしてた人たちは、自分たちのせいかと思って顔面蒼白になっただろうね…

perching_aix 2025/06/12 19:06:32

ポストモーテムで原因が分かるだろうね。こういう時こそ学びがあって、良い報告書を読むのが楽しみなんだよ。

solardev 2025/06/13 09:41:43

そうだよ。Cloudflareは業界でもトップクラスの良いポストモーテムを書いてて、読むのがすごく楽しいんだ。URL：https://blog.cloudflare.com/tag/post-mortem/
こういう透明性や責任を持つ姿勢は本当にすごいと思う。誰だって失敗するけど、多くの会社は間違いを隠そうとするんだよね。Cloudflareのやり方を見ると、もっと信頼できるって感じるよ。

perching_aix 2025/06/12 19:44:37

＞これって公開されるの？
うん、そうだよ。

jonfw 2025/06/12 19:34:28

あのページにはいつも予定メンテが載ってるから、僕の経験からすると、それはあまり当てにならないサインだよ。

sidcool 2025/06/12 23:18:12

Cloudflareのラバランプが暗くなってるみたい。

もっとコメントを表示（2）

poorman 2025/06/12 20:52:33

このポストモーテムが待ちきれないよ。Google Cloudの停止がCloudflareのサービスをダウンさせるって、なんだか変な感じ。

iimblack 2025/06/12 18:41:40

インシデント情報が更新されたって。
影響は認証だけじゃないらしいよ。

pier25 2025/06/12 20:10:38

Workersアプリは動くようになったよ。
追記：USはOKだけどEUの顧客はまだダウンしてるって。
追記：EUの顧客からも大丈夫になったって報告きてる。

b0a04gl 2025/06/12 19:02:43

分散システムってのは壊れるもんだろ、それが普通。
大事なのはどれだけ早く被害を抑えて、エンドユーザーにバレないか。
KVがauthとかUIとかWorkers全部巻き込んでるなら、障害分離ができてない証拠。
復旧はいいけど、ローカルの問題直すのに全体で連携しなきゃいけないのは設計がイマイチ。
完璧な稼働時間じゃなくていいけど、復旧後はもっとスムーズに感じなきゃ。
今はシステムは助かったけど、インターフェースがダメだった感じだね。

PeterStuer 2025/06/13 06:41:52

Cloudflareの認証もGoogleのIDシステムも昨日けっこう長い時間止まったね。
これってなんか技術的な繋がりがあるのかな？

tom1337 2025/06/13 08:42:23

Cloudflareははっきり言ってないけど、ブログにはこう書いてあったよ。
「今回の障害原因はWorkers KVサービスの基盤ストレージインフラの障害。これは多くのCloudflare製品の重要な依存関係で、設定とか認証とかアセット配信に使われてるんだ。
このインフラの一部はサードパーティのクラウドプロバイダーが提供してて、そいつが今日停止してKVサービスに直接影響したんだ。」

pier25 2025/06/12 18:42:57

Workers KVがもう30分以上止まってる。マジで深刻な影響が出てるよ。
APIもダメだ。
あれだけ冗長性あるのに、こんな風に全体に影響するなんて信じられないね。

kenhwang 2025/06/12 20:07:54

インシデントページ(https://www.cloudflarestatus.com/incidents/25r9t0vz99rp)によるとね、
「Cloudflareの重要なWorkers KVサービスは、キーとなる依存関係であるサードパーティサービスの停止でオフラインになった」って。
このサードパーティってGCPじゃないかと俺は見てるね。
Cloudflareのデータセンターで動くってめちゃくちゃ売りにしてたんだから、冗長性のためにWorkers KV使ってたCloudflareの顧客だったら相当キレると思うわ。

nijave 2025/06/12 19:26:33

CDNとWAFは大丈夫みたいだね。
Cloudflareは古いサービスとかコアサービスほど信頼性高くない新しいサービスを急いで出しすぎたんだと思うよ。

vimwizard 2025/06/12 19:03:32

プロキシはだいたい大丈夫みたい。
たぶんWorkers関連のローカルな問題だね。
Identity access rulesでZT tunnel通してる俺のサイトの一つだけが影響受けてるからさ。

ineedaj0b 2025/06/12 18:51:24

もしかして太陽フレアが原因？

CoopaTroopa 2025/06/12 19:09:31

いやいや、記事はCloudflareが止まったって話でしょ。

joduplessis 2025/06/12 18:59:30

今回の停止を引き起こしたプロンプト（もしAI関連なら）も公開してくれるといいんだけどな。

daxfohl 2025/06/12 19:09:43

ポストモーテム（事後検証）はもうAIにやらせちゃえばいいんじゃね？

vsgherzi 2025/06/12 20:03:29

彼らはただ”速く動いて色々ぶっ壊す”を100倍の速さでやってるだけだろ。コードの中身なんてどうでもいい、全部ノリと勢いで乗り切れってかｗ /s

記事一覧へ

著者

海外テックの反応まとめ

暇つぶしがてらに読むだけで海外のテックニュースに詳しくなれるまとめサイトです。