Kiro 登場!AIが開発プロセスを自動化する新世代IDE
引用元:https://news.ycombinator.com/item?id=44560662
やあ、みんな!Kiroの開発に1年近く費やしたよ。IDE分野でKiroがユニークな理由を話せるのが嬉しいな。「spec driven development」がAmazonの巨大プロジェクト構築プロセスを基にしてるんだ。曖昧なプロンプトも深い技術要件やデザイン文書、タスクリストに展開できるよ。Kiroでの開発は本当に楽しかったし、Kiroで作った無限クラフトゲームのコードベースも公開してるんだ。約95%がAIコーディングだよ。見てみてね: https://github.com/kirodotdev/spirit-of-kiro
Kiroっていうか、この手のAIアプリ全般へのフィードバックなんだけど、新しいコーディングエージェントを試す最大の障壁は、既存エージェントで設定したカスタムルールなんだよね。Copilotとか色々使ってきたけど、今Claude Codeにルールを移植し終えたばっかりで、これはもう二度としたくないよ。ドラッグアンドドロップみたいに簡単でも無理。企業は他のアプリからの移行フローを改善すべきだね。ルールをそのまま持ってくるか、LLMエージェントが変換してくれればいいのに。
なんでエディタにしたの?CLIじゃないの?VS Codeとか僕にはすごく遅いから、CLIの方が良かったな。
製品自体は好きなんだけど、実装はもっと良くできるんじゃないかな。Kiroは理由もなくHelper PluginがCPUを大量に消費したままで、アイドル状態なんだ。
こんにちは!AWSとの関係って何?AWSで働いてるの?これってAmazon QとかBedrockがバックアップする、AWSの公式製品になるの?
KiroはAWSチームが作ったもので、AWSの専門知識がもとになってるよ。AWS内ではKiroを推奨開発ツールの一つとして内部で使ってるんだ。だからKiroは公式のAWS製品だけど、コアAWSとは少し分けてるんだよね。例えば、AWSアカウントがなくてもKiroは使えるよ。GoogleやGitHub経由でソーシャルログインもできるんだ。KiroはAWSに支えられてるけど、それ自体が独立した製品で、AWS顧客だけでなく、もっと幅広い層にアピールしたいと思ってるんだ。
乞うご期待!CLI版も出す余地は確実にあると思うな。とはいえ、IDEにはCLIよりも機能面で大きな利点があるんだ。例えば、IDEが“遅い”と感じるのは、Linterやコードフォーマッター、型チェッカー、LSPサーバーなど、より多くの機能が最初から備わってるからだよ。IDEで動くエージェントは、これらのコンテキストを全部使って、より良い結果を出せるんだ。例えば、KiroはIDEの”Problems”タブの問題を自動で検知して解決しようと試みるんだ。開いてるファイルも見て、適切なコンテキストに素早くジャンプしようとするよ。IDEエージェントの可能性はCLIエージェントよりずっと高いんだ。使えるツールも多いし、何をしてるか、どこで作業してるかといった情報も多いからね。
OSXでソーシャルログインが動かないみたいなんだけど。Kiroをダウンロードして、Googleオプションをクリックして、アプリを許可したら、”Error: AuthSSOServer: missing state”っていうエラーでhttp://localhost:3128/oauth/callbackにリダイレクトされちゃうよ。
これに関する標準化された規約があれば本当にいいのにな。AGENTS.mdとかさ。ツールが違うだけで、本質的に同じ目標のために複数のファイルやルールを用意しなきゃいけないなんて、おかしいよ。
ルール形式は~/.config/llms/rules.mdみたいな標準的な場所に置くべきだよね。
「Electron Helper (Plugin)」が10個もあって、それぞれが1GBのRAMを食らうとか、最近のデスクトップ体験はひどいね。もうネイティブアプリは作れないのか?
報告ありがとう!KiroのSSOフローについて確認するね。localhost:3128へのリダイレクトは正常だけど、stateが欠けてるのは異常だね。ブラウザ拡張機能とか、君の環境がSSOフローを邪魔してる可能性があるね。引き続き注視するよ!
ほぼ95% AIコードってさ、出力に対して明確な期待値がなかったからじゃない?ある程度それっぽく見えればOKだったんでしょ。
KiroはSteering Rulesを作るのが得意だよ!これは本当にお気に入りの機能で、大規模プロジェクトに超役立つんだ。オレのオープンソースプロジェクトで自動生成されたSteeringファイルを見れるよ: https://github.com/kirodotdev/spirit-of-kiro/tree/main/.kiro
これらはMarkdownファイルだから、他のツールのルールファイルも.kiro/steering
ディレクトリに置けばそのまま使えるぜ。
それって古い話だよね。Claude CodeやAmazon Q CLIもMCPを通じて、LSPサーバ接続やrepo-maps、コードインデックスの計算、Linter連携とか、全部できるよ。オレの意見では、CLIの方が可能性を秘めてるし、CI/CDに統合したり、並列実行したりするのも簡単なんだ。
それってHarper Reedの”My LLM codegen workflow atm”に似てる?https://harper.blog/2025/02/16/my-llm-codegen-workflow-atm/
いくつか理由があるよ: Kiro(とほとんどのAIエディター)は、最初に起動した時にコードベースをインデックス化するからCPUを多く使うのは普通なんだ。あと、VS Codeのプラグインをインポート・インストールする時もそう。これは初回だけの一時的なものだよ。CPUがスロットルされてる時に少しの利用でも利用率が高く見えることもあるね。オレの環境ではほとんど0.4%以上になることはないから、CPU利用率が高いならこれらの理由のどれかだろうね。
違うね。高品質を維持するために、最初の結果を却下してより正確なプロンプトでコードを再生成することはしょっちゅうだったよ。Kiroに期待通りのコードに変更してもらうために”refactor prompts”もよく使ったね。AIを使っているからといって、品質を気にしなかったり、思考を停止して最初の結果をただ受け入れたりするわけじゃない。AIとコーディングするのにはまだスキルと技術が必要だけど、以前よりもはるかに早くコードを捨てたり、再生成したり、再構築したりできるんだ。このプロジェクトでは、手動入力を可能な限り避け、Kiroにプロンプトを使って必要な結果を出させる方法を見つけた。だから95%がKiroによって書かれたんだ。その過程で、プロンプトのスキルも向上したし、最初のパスで承認できる成功率もずっと高くなったよ。初期の頃は、もっとモデルがバカだったし、オレ自身のプロンプトスキルも低かったから、コードの一部をより正確な指示で3、4回再生成することもよくあったね。
precise promptなんてものがあるなら、プロンプトをrepoにチェックインして、CIがプロンプトから最終アプリをビルドしてデプロイできるはずだろ。つまり、ランダムな出力の95%を受け入れてるってことは、すごく単調で簡単な作業をしてるか、出力の形(品質とは違うぞ)を全然気にしてないかのどっちかだよね。この場合、君はプロダクトオーナーでもあって、何が受け入れられるかの最終決定権も持ってたわけだしさ。
返信ありがとう。インデックス作成のことだったんだね。これってどうにか制御できないの?files.watcherExclude設定があるんだけど、それってちゃんと反映されるの?
そうなんだよ!数か月前この投稿を見て、”すごい、俺たちが作ってるものにそっくりだ!”って思ったんだ。Kiroはrequirements、design、tasksの3つのファイルを使うんだ。requirementsは思いつかなかったようなエッジケースを定義する。designはコード現状と要件の差異、必要な変更を洗い出す。tasksは大きな開発フローをLLMが扱える小タスクに分割して、エージェントがそれを追跡する。正直、”Cookie Clicker”みたいに自動でできるってのは無理だと思うね。LLMには熟練した人間のSDEがまだ必要だよ。でもKiroは、AIエージェントが難しい大規模タスクをスムーズに処理できるように手助けしてくれるんだ。
AWSの顧客がBedrockに接続したり、それ経由でモデルを使ったりする計画ってあるの?
> 例えばIDEが”遅い”と感じるのは、機能が多いせい:
IDEは遅いと感じるんじゃなくて、実際に遅いんだよ。HTMLとJavaScriptで書かれてるからさ。2005年のDelphiを試してみなよ、超速いし、機能ももっと充実してるんだから!
> Kiroのおかげで、無限クラフトゲームのコードベースはほぼ95%AIが書いたんだってさ:https://github.com/kirodotdev/spirit-of-kiro
これと”CHALLENGE.md”、”ROADMAP.md”はプロジェクトをデモるのに超クールなやり方だし、遊び場にもなるね。ゲームのアイデア自体もかなり面白い。AWSを使わずに試せたら最高なんだけどな。Agentic Codingの良いユースケースかもね:”Kiro、これローカルDBとAnthropic APIキーだけで動くようにしてくれ!”って。不満はともかく、デモとしてはめちゃくちゃクールなフレームワークだね。ナイスアイデア!
それが俺が使ってる規約なんだ。俺のCLAUDE.mdとGEMINI.mdは両方とも”AGENTS.mdを見てくれ”って書いてあるよ。
AGENTS.mdは少なくともCodexとGitHub Copilotの両方で使われてるね。VSCodeは指示ファイル用に独自の物を持ってるし、Claude.mdもまた独自の物なんだ。残念。
“Xなんて絶対やりたくない”
“Kirkはこれ、かなり得意だよ。Xをするだけさ”
“…”
.vibecodingrcの方がいい感じに聞こえる?
ちなみにGitHubログインはできたよ。俺が使ってる拡張機能はパスワードマネージャーとKagiだけだね。
ファイルのインデックス除外は.gitignoreに基づいてて、files.watcherExcludeじゃないと思うんだけど、ちょっと確認してみるわ。
もっとコメントを表示(1)
FAQからの重要情報だよ。ProかPro+ティアならコンテンツは基盤モデルの学習に使われない。AWSはテレメトリーを収集するけど、IDE設定でオプトアウトできるよ。Freeティアとプレビュー期間中は、明示的にオプトアウトしない限り、コンテンツがFM改善に使われる可能性がある。Amazon Q Developer Proサブスクリプションならコンテンツは使われないってさ。詳細はこのURLを見てね。
https://kiro.dev/faq/
Kiroでテレメトリーデータを共有しないようにするには、次の手順で設定してね。
1. Kiroで設定を開く。
2. ユーザーサブタブに切り替える。
3. アプリケーションを選択し、ドロップダウンからテレメトリーとコンテンツを選択する。
4. テレメトリーとコンテンツのドロップダウンフィールドで、無効を選択してすべてのテレメトリーとユーザーデータ収集を無効にする。
情報源はここだよ。
https://kiro.dev/docs/reference/privacy-and-security/#opt-ou…
これ、ちゃんと機能するか確認する方法あるの?それとも設定が守られるって信じるしかないの?
AIモデルを使うのと同じで、アクセス権を与えたインターフェースで悪意のあることをしないって確実には分からないんだよね。信じるしかないよ。
まあ、少なくともAWSとかへのネットワークトラフィックがあるかチェックできるじゃん。
でもそれって、実際にモデルにクエリを送るのと見た目同じじゃない?俺、ジョーク見逃してる?
悪意のある振る舞いが既に起きてるなら、それに対処する方法は常にあるさ。
他のすべてについてもそうだけど、信頼だよ。相手への報復の恐れで強化されることもあるけどね。適当なインターネットサービスが俺たちのメールとパスワードを売ってないってどうしてわかる?彼らはハッシュ化されたパスワードを保存してるだろうけど、俺たちが入力するたびに平文で受け取ってるわけだしね。
ネットサービスがパスワードをどう扱うかなんて信用できないよね。入力時は平文だし、結局サービスごとにユニークなパスワードを使うしかない。でも、コードだとこれは難しいんだよな。
ネットサービスを信用するなら監査をチェックすべき。全てのサービスが監査されてるわけじゃないけど、データ渡す前にそこは考えた方がいい。
自分のコードに独自の文字列入れて、将来のFoundation Modelが補完するか試せるかも。弁護士じゃないけど、お金を払えばもっと法的拘束力があるかもね。Amazon Q Developer Proはめちゃ安いらしいよ。https://aws.amazon.com/q/pricing/
企業はLLMへのコンテキストを重視してるけど、本当にトレーニングデータとして有用かな?ほとんどがLLMの出力で、コードの品質も人間より悪いし、開発で却下されたコードも混ざるだろうから、きちんとフィルターしないと価値があるか疑問だよ。
コード自体より人間とAIのインタラクションが超重要だと思う。ユーザーがAI使ってリアルタイムで修正する様子は、AIの改善に直結する。いつかAIがテストを勝手に無効にしないように学習するかもね。
コード出力より、人間がLLMの要件や設計を調整するプロセスが大事。今やボトルネックはコンテキストとプロンプトだから、人間とのインタラクションデータを集めて最適化するのがいい戦略だと思う。ユーザーがAmazonに設計書のラベル付けをしてるって感じだね。
YCの会社だったかな、製品化されなかったプライベートなコードリポジトリを買い取ってたのを見たよ。LLMの汚染を避けるために2022年以前のコードを求めてたはず。トレーニングデータにするみたい。うろ覚えだけどね。
製品のテレメトリ、つまりAIとのやり取りの成功率とか、編集の必要性とか、ツールの使い方とか、コンテキストやプロンプトのチューニングデータの方が、単にコードをモデルに食わせるよりずっと製品にとって有用だと思うよ。
これはAssemblyからCへの移行みたいに、ソースコード自体を気にしなくなる時代の始まりだね。Privacyも大事だけど、それが本質じゃない。Kiro使ってみたけど、ClaudeやCrystalと変わらず普通だったよ。
数年後にはソフトエンジニアは激減するだろうね。さあ、The Matrixへようこそ!Hacker Newsのこの記事のコメントもチェックしてみて。https://news.ycombinator.com/item?id=44567857
”あなたのコンテンツはFoundation Models(FMs)のトレーニングには使わない”って言ってるけど、それってFoundation Model以外のLLMには使うってことだろ?たとえもっと広い免責事項だったとしても、俺は信用しないけどな。
プライバシー侵害の教訓から、「データは使わない/売らない」なんて嘘だってバレバレだろ。信用するなんて無理だね。21世紀最大の嘘だよ。
AI業界、特に大手が知財権を無視して、クローラーがDDoSボットみたいに振る舞うのはマジでタチが悪いよな。
IDEを半年ごとに変えるのは嫌なんだよな。AIは動きが早すぎて、すぐ新しいのが出てくるし。CLI/TUIが結局一番って思うんだけど、GUI使う人も多いんだろうな。
半年どころか2週間に1回だよな。うちはClaude Codeでうまくいってるぜ。
大体VS Codeベースだから、乗り換えはそんな大変じゃないでしょ?今はまだ差が小さいけど、CursorとかVS Codeの更新に追いつけてない部分もあるみたいだね。
AIの“エージェントモード”は嫌いなんだ。コードは全部自分でコントロールしたいし、責任も取りたい。Claude Codeは“ask”フローにいいの?エージェントモードって、確認なしに勝手にファイル編集するってことでしょ?
VS Code使ってない人も多いから、TUIの方がいい選択肢だと思うな。
KiroはCursorが人気だった頃にAmazonが作ったっぽいけど、今はClaude CodeみたいなCLIエージェントに市場取られてるから苦戦しそうだな。無料でもないし、CursorやClaude Codeみたいに使い放題でもないんだろ?
だからVimと自分の脳は絶対手放さないね。IDEだけでなく、MLモデルに自分を売るようなものだ。同僚が能力落ちていくのを見てるし、AIの金が尽きたらどうなるんだ?
でも、Cとかアセンブラしか書かない老害みたいに取り残される可能性もあるよな。変な技術トレンドでも、この業界って一度始まったら絶対元に戻らないんだよ。
aiderが各編集をgitコミットにカプセル化するやり方は好きだな。これ、もっと広まってほしいね。
こういうエージェント型IDEって、全部VS Codeのプラグインでよくない?たぶん、プラグインだとVCからの資金調達が難しいから、そうしないんだろうね。
もっとコメントを表示(2)
ちょっと皮肉な話だけど、Amazon Q Developer CLI(これって実質Claude Codeを少し変えただけ)って、Claude Codeよりずっと前に出てたのに、ほとんど注目されてないみたいなんだよね。
俺はC言語書いてめちゃくちゃ稼いでるんだけど?何が言いたいの?トレンドに関しては、この手のサイクルはもう何回も見てきたからさ…。
aiderは残念ながら古くなってきたね。できることはすごいけど、より良いLLMとエージェント技術を使えば、ソフトウェアエンジニアリングの領域でもっと成果が出るって示されてるんだ。
最近の論文では、LLMがツールハーネスを進化させて、aiderよりベンチマークで約20%も高い結果を出してたから、モデルとツール(あとより良いハーネス)の方がaider単体より優れてるのは明らかだね。
Claude CodeはClaudeのおかげだし、TUIかどうかってのは本質じゃない。IDEがTUIに負けるのは、エージェントモデルがコーディング以外にもっとたくさんのことをやって、ハンズオフなワークフローに進化してるからだ。
ごちゃごちゃしたIDEはそれに合わないけど、TUIも違うんだよね。TUIが主流になったことなんてあったっけ?
未来のエージェントツールは、リッチなノートブック/チャットインターフェースで、あらゆるフォームファクタで利用できるもの、つまり、たぶんウェブ/クロスプラットフォームアプリになるだろうね。
いやいや、実際、仕事でいくつか違うAIソリューションを試したけど、エディターが同じでも体験は常に微妙に違うんだよ。
プロンプトテンプレートの使い方とか、パネルを開くとか、そういう細かい部分がね。(もちろんキーバインディングをカスタマイズしようとすればできるけど、そんなにすぐ変わるのにわざわざやる意味ある?)
もっと大事なことだけど—プラグインってどうやって収益化するの?
>俺はC言語書いてめちゃくちゃ稼いでるんだけど?何が言いたいの?
言いたいのは、君みたいな人はそんなに多くないんじゃないかってことだよ。
全体的に見て、業界のトレンドに乗り続ける方が、キャリアパスとしてはより確実だからね。
- aiderにはどんなモデルでも組み込めるよ
2) かなりエージェント的になれるんだ
>ツールハーネスを進化させる
Claude codeもGemini cliとかも、これもできないんだよね。
長期的にはCursorやVS CodeみたいなIDEが勝つと思うぜ。若い世代が育ってくるからな。でも短期的にClaude CodeみたいなCLIツールが流行ってるのは、ガチ勢のデベロッパーが「初心者との最後の差別化」だと思ってるところがあるんだよ。ターミナルもLinuxも知らない奴が多いって分かってるからね。
「半年ごとにIDEとかエディタを乗り換えて、新しいキーバインドや見た目に慣れるのが嫌だ」って言うならさ、それって実質GNU Emacsを推奨してるってことじゃん?って思うんだよね。
https://github.com/karthink/gptel
Claude Codeも好きだけど、IDEにはCLIツールよりいくつか利点があると思うよ。特にIDEは開いてるファイルやLSPの情報など、コンテキスト情報が格段に多いんだ。LLMの結果にはコンテキストがめちゃくちゃ大事だから、IDE内で動くエージェントの方が性能の天井が高いんだよ。Claude Codeも将来的にはIDE並みになるだろうけど、今はIDEの方がコンテキストをすぐにLLMに渡せて遅延が少ない。
Continueとか、他にもたくさん似たようなことやってる奴らがいるぜ。それより、なんでソフトウェアスタートアップではVCから金を集めるっていうひどい「モノカルチャー」がはびこってるんだ?もっと役に立つものを作って、ちゃんとした値段で売る普通のビジネスが必要なんだよ。
「Cやアセンブラしか書かない老害みたいに取り残される」って言うけどさ、俺が知ってる限り、そういうスキルを持ってるアメリカの奴らはとんでもない額を稼いでるぜ。もちろん、金持ちになって引退した奴らは別だけどな。
aiderは大好きで昔から使ってるけど、最新ツール(Claude CodeやGeminiとか)の方が全体的な「利益」は大きいと思う。aiderの制約の中でモデルを動かすより、Claude4みたいにAgenticフローに優れてる方がいいしな。俺はprovider_tool + provider_LLMの方が、短期的にも長期的にもサードパーティツール + 同一モデルより優勢になると思うぜ。
そうだな、でも俺たちは決して代替可能じゃないんだ。それが信頼できるキャリアを築く秘訣だよ。俺は1995年以来、すべてのリストラを生き残ってきたぜ。
「IDEを使うのはダサい」っていう考え方、俺は正直バカげてると思うんだ。俺は1994年の大学時代からTurbo C IDEを使っていたし、Visual Studioは2019年まで、それ以降はVSCodeを使ってるからな。
IDE内でもエージェントループはできるし、「IDEがTUIに負ける」なんてことはないと思うぜ。むしろTUIってのは「人間が介在するけどツールが貧弱」っていう、自動化とAIの手動レビューの中途半端な立ち位置だろ。Claude Codeの無駄に可愛い囲みテキスト入力でのコピペはマジで嫌いなんだよ。ZedのAIエージェントの実装はまだClaude Codeに及ばないけど、IDEに本質的な問題があるわけじゃないしな。
https://zed.dev/docs/ai/agent-panel
OpenAIのCodexはIDEじゃなくてウェブ製品で、既存のワークフローにGitで統合できるのが良いって。IntelliJユーザーからすると、KiroみたいなAI-IDEは機能不足で、かなりのダウングレード。AIは開発者を置き換えるんじゃなくて補助するもの。LLMにはイライラさせられるけど、退屈な作業やバグ修正には役立つ。UXと速さが重要で、ChatGPTの即時性が好き。KiroはIDE不要者にはいいけど、俺には合わないな。
VSCodeでClaude Codeを使っててさ、Cmd-Escでタブを開いて、/ideでVSCodeに繋げると、Cursorみたいに使えて便利だよ。
AIツールは開発者を『置き換える』ってPMや投資家は考えてるみたいだけど、実は『強化する』のが一番なんだよね。一括で提案を受け入れるより、対話的なペアプログラミングみたいなアプローチが良いはず。Claude Codeがそれに一番近いと感じるよ。うまくプロンプトすれば、もっと対話的に作業できるんだから。
仕様重視って考えはすごく良いね。俺もClaude Codeでテキストで仕様を管理してるよ。コード生成より、考えたことをドキュメントや図にまとめるのに価値を感じるんだ。Kiroが俺の今のやり方よりどう優れてるのか知りたいな。特別なDSLとかあるの?何ヶ月も慣れてきたプロセスを捨てるのは大変だよ。価格も、Bedrock価格にマージンが乗るのか気になるな。
Kiroが優れてるかって?それは試してみて自分で判断してほしいな。個人的には要件定義や設計ドキュメントのフォーマットが好きだよ(Mermaid図もね)。価格は月額制で、インタラクション数に上限があるんだ。人が1回『プッシュ』するごとにカウントされるけど、Kiroはそこから自律的に何ターンもコードを生成するから、かなりたくさん書けるよ。詳細は https://kiro.dev/pricing/ を見てね。
価格リンクありがとうね。プレビュー中は無料だと思ってたよ。月39ドルで3000インタラクションって多いのかな?Claude Codeの30ドルプランだとすぐに上限に達しちゃうんだ。次の200ドルティアは高すぎて、うちのNGOじゃそこまで開発にお金は出せないからね。
直接比較は難しいけど、3000インタラクションは本当にすごく多いよ。1回のインタラクションでKiroが3~5分コードを書き続けるイメージだね。適切なプロンプトを使えば、とんでもない量のコードが書けるはずだよ。計算すると18.75営業日分くらいになるけど、実際には一日中使い続けるわけじゃないから、月の作業には十分すぎるくらいだね。
うん、まさに知りたかったことだよ。この上限に達するなんて想像できないね。CADだとちょっと高くなるけど、Claudeで制限に引っかかるのが嫌だから、もっと払ってもいいくらいだよ。俺の使い方は集中することが多いから、数日使わない時もあれば、アイデア出しや仕様検討で何度も制限に引っかかることもあるんだ。この価格設定は俺のユースケースにピッタリだね。
Claude Codeには20ドル、100ドル、200ドルのプランがあるんだって。
ああ、ありがとう。俺は約30CAD払ってるけど、上のプランは200USDなんだね。USDで話すべきだったよ。