AniSora アニメ動画を生成するオープンソースAIが登場!
引用元:https://news.ycombinator.com/item?id=44017913
これさ、どう見てもwebtoonsとかmanga、たぶんpixivとかで学習してるのが明らかだね。アートはテキストと違って人間が必要不可欠で、アーティストがAI学習の役割に追いやられるかも。でも、好きなものを描いて学習データにするなら悪くないかも。AI推進派だけど、これまでエンタメを支えてきたアーティストはどうなるのか、質の向上は続くのか、挑戦的なスタイルが消えて全部同じになるのかって心配。なんか、これが終わりの始まりみたいで。
イラストレーターに同情するのはいいけど、訓練データが小説とか絵とかコードとか、何でも結局同じだよ。うちの母さんは翻訳家だったけど、機械翻訳が進んで仕事も賃金も減ったんだ。結局、定型的な仕事は、もっと安いロボットにやらせるようになるってことだね。
議論はこれね:
彼女(翻訳家)の翻訳の出力には著作権がなかった。言語は翻訳家とは無関係に発展した。
アーティストの出力には著作権がある。アーティストは彼らが出力する空間を形作る。
今恐れられているのは、新しいアートを生み出す市場がなくなったら、その空間が停滞するんじゃないかってこと。
著作権ってすごく複雑で曖昧だよ。アートの著作権侵害判断は難しいし、フェアユースみたいなグレーゾーンもある。著作権は検閲やイノベーションの邪魔にも使われるって意見もあるね。人間も完全にオリジナルじゃなくて、お互いに影響を受けてる。”Good artists copy; great artists steal”って言うくらいだし。AIも元データから無限に近いパターンを作れるから、人間が斬新だと思うアートを生み出す可能性はあると思うんだ。テクノロジーは法律よりずっと速いから、AIの時代に合わせて著作権みたいな法律も考え直す時期に来てるんじゃないかな。
> Art is something that cannot be generated like synthetic text
10年前:”リアルな文章は定型文みたいには生成できないから、ライティングはずっと人間のライターに頼るしかないだろう”って言われてた。
> As my mom retired from being a translator, she went from typewriter to machine-assisted translation with centralised corpus-databases. All the while the available work became less and less, and the wages became lower and lower.
彼女は引退できてラッキーだったね。翻訳家は確実に extinct するだろう。機械学習モデルの方がcommercial human translationsよりalready higher qualityだし、これからもっと良くなる。人間翻訳家みたいにサボったりpolitical beliefsでわざとmistranslateしたりしないしね。
”text”は関係ないと思うな。区別はアートと合成されたものにあるべきで、アートは書かれたものでも視覚的なものでもあり得る。それは vague な言葉で、よく”graphics”を意味するのに使われてて、話を confusing にしてるし、アートの意味は endless に議論されてるね、知能の意味みたいに。
明らかに合成graphicsはある(合成textみたいに)。だから”art”って言葉でここでは別の何かが意味されてるはず。
アーティストは限界を押し広げるんだ。
AIツールを使えば、アーティストはさらに先に進めるようになるよ。まだAIができないことをするんだ。
オリジナル作品を出すと著作権無視でAI学習に使われるとアーティストは考えて、作品公開をやめちゃうと思う。music streaming が音楽の質を下げたように、AIもイラストに同じ影響を与えるだろうね。でも”現代アート”みたいな_art_はAIには難しくて大丈夫そう。それはたぶん AGI complete task だろう。AIの能力はすごいけど、アーティストの努力を利用して仕事を奪ってる現状は悲しい。昔の real hackers は権力に反抗したのに、今のテックコミュニティは greed の担い手になっちゃった気がする。
Disclaimer:僕は30年以上の経験があるアーティストだよ。
AI学習用への格下げ? Nonsense だね。アーティストがお金のためだけに描いてるわけじゃなくて、FUN のためにも描いてることを忘れちゃダメだよ。このちょっとした詳細が、僕がここ3年間読んでる AI 関連の every single discussion から抜け落ちてるんだよね。
どういう意味?
AIがどうやってアーティストをダメにするの?
AIが自分より上手くて早くても、自分のアートには全然関係ないじゃん。
人間で自分より上手い人がいるのと同じだよ。
まあ、他のアーティストに嫉妬しまくる人もいるけどね。
価値のあるアーティストなら毎日努力するもんだし、もし「もっと良いもの”」があるからってやる気なくすなら、それは自己成長じゃなくて競争心が原因でダメだよ。
アートは自分自身との競争で、それが分かんないアーティストは最初から doomed だね。
曖昧だからって、良い結果をもたらす法律に反対するのはダメだよ。
曖昧じゃない法律なんてほとんどないしね。
殺人とか正当防衛とか事故の境目なんて現実にはっきりないじゃん。
(周波数帯とか登記とか明確な法律もあるけど。)
著作権とAI学習は何か変わるべきだけど、法だけじゃなく技術でも解決できるかもね。
僕の予測ね。
メディアは家具みたいになると思うよ。
昔は家具って手作りで高かったけど、今はほとんど大量生産で安く買えるじゃん。
ユニークなのはまた手作りになるけど、これで大体みんなOK。
メディアもああなると思う。
AIがアルゴリズムで自動で作る、大量のパーソナライズされたメディアが主流になるよ。
人間の演技や脚本による「手作り」メディアもニッチに残るけど、それは高価で金持ちの自慢になるんだ。
良い理想論だね。
でもそれじゃ飯食えないよ。
アーティストは生活のためにアートやめてバイトしたりするんだ。
AIは絶対に競争相手だってば。
>人間が作ったアートは完全にオリジナルじゃない。
ここでのポイントは、人間は1個のサンプルを使えるけど、AIは大量の学習データの torrent が必要ってこと。
あとAIがサンプルの permutations を生成する時、その統計って学習データと合ってるの?
>法律の曖昧さ
殺人とか正当防衛とか事故の定義は、だいたいどこでもすごく厳密に決まってるよ。
曖昧さは事実を判断するところから生まれるんだ。
>著作権とAI学習
うん、でもこれってAIだけの問題じゃないんだよね。
何が derivative なの?って話で、「新しいもの”なんてない」って考えたら、むしろ主観的な問題だよ。
問題はさ、ゲームが好きで作ってるアーティストたちがさ、スタジオが金のためにゴミ(HN風に言えばMinimal Viable Products)を大量生産することでさらに追い出されるかってことなんだよね。良い脚本家やセットデザイナー、ディレクターが必要なドラマとかシットコム1本に対して、使い捨てのリアリティTV番組が15本くらい作られてるでしょ。
LLM、特にOpenAIのは長いと適当なこと言うし、言語によっては翻訳が酷い。Grokみたいに学習データや指示でバイアスも出る。それに言語で世界の捉え方が違うから、正確な翻訳って難しいんだよね。
好きな絵を描いて学習データにするってディストピアみたいだろ。それは”アート”じゃなくて、機械の歯車だよ。”アート”ってのは適当な絵を描くことじゃない。アーティストはどうやって食っていくんだ?そんな奴らを誰が雇うんだ?
スタイルが皆同じになるって?もうとっくにそうなってるよ。ウェブは偽物やクソ画像だらけで、詐欺やスパムの方がまともな利用より儲かってるんじゃないか。これからもっと酷くなるぞ。
“アートは生成できないものだ”
もちろんできるよ、自分の目で見てるだろ。
これは機械による派生的な視覚素材の生成だと思うな。少なくとも俺の中では違いがあるんだ。“アート”ってのは文化的な活動と表現で、そこには意図、創造性、想像力が必要なんだよ。
壁紙を延々と印刷してるプリンターは“アート”を作ってるわけじゃない、最初にそのパターンを作るのに芸術性が関わってたとしても、今印刷されてるものはね。
君の言ってることはおかしい。
新しいアートを生み出すのは止められないし、ツールが手軽になればもっと増える。ミームだってアートの一形態だよ。
俺が本当に心配なのは、皆が同じアートを経験しなくなることだ。それは社会的な繋がりを失わせる。AIはそれをさらに悪化させるだろうね。
“だからこれって明らかに著作権のある素材で学習されてるんだ。”
そうなのかな?この製品については何も知らないけど、Novel AIはタグ付けされたアニメ風画像のデータベースにお金払ったのを覚えてるよ。ここで同じようなことが起こってないとも限らないんじゃないか。
俺はCorridorの“paper rock cross blade”ショートフィルムは絶対素晴らしいと思うし、完全にアートって呼べると思う。もし3作目作るなら、多分このモデルを使うだろうね。
スタイルを失うって話は、もうずっと前から起こってるよ。Disneyがインクじゃなくてxeroxingに移行して、インクが“難しすぎる”って理由でスタイルを変えた。90年代後半から2000年代初頭には、Flashアニメーションのスタイルでテレビアニメがたくさん出てきたけど、それはFlashで作るのがずっと簡単で安かったからだ。
法律は精密に見えても、裁判は人間の判断で曖昧になる。技術側も適応できる。問題は学習じゃなく、モデルが個々の作品やスタイルを再現・転用して、他人の努力の価値を下げることだ。これはフェアユース違反だ。
学習データを工夫して、特定の作品を覚えさせないようにすればいい。ノイズを加えるみたいな単純な方法でデータ問題は解決してるんだから、アートでもできるはず。解決しようとしてる人も多いよ。
どうやって思いついたの?
ついに自分たちの手でHaruhiのシーズン3が作れるようになるなんて、もうすぐそこまで来てるね… 生きててよかったよ.
その話はまた5年か10年後にしようぜ.俺にはまだそんなすぐって感じしないんだよな,どうなるか興味あるけど.
文字通り,俺が初めてちゃんと見たアニメシリーズだよ(映画とかDBZは除くけど).監督がぶち壊してマジ腹立つけど,誰かが完結かリブートしてくれたら人生最大のプレゼントになるな.
それかNGEを直して
もっとコメントを表示(1)
完璧なものは直せないだろ
germanのアクセントはもしかしたら直す必要があるかもね.
たぶん,今すぐできると思うよ.Speech modelsはexcellentだから.
うわ,このアニメ10年以上ぶりくらいに聞いたわ.懐かしいな.
え,ちょっと待って… マジで終わってないってこと?俺今シーズン1初めて見てるんだけど…
俺の考えだとさ、
1.Haruhiはラノベが原作だから、出すにはちゃんと実績が必要なんだよ。日本市場って逆になってて、アニメはしばしば漫画を売るためにタダで放送されて、そこで本当の金になるらしい(経済的にどうなってるかは分からないけど、そう説明された)。もう新しい漫画やラノベが出てないから、次シーズンの可能性は低いかな。なんか、元々情熱的なプロジェクトだったみたいね。
2.スタジオが放火されたし。https://en.wikipedia.org/wikipedia/wiki/Kyoto_Animation_arson_attack
3.シーズン2は評論家には酷評されたけど、俺はかなり天才的だと思ったね。
俺からの提案は、両方のシリーズを見て、その後にラノベの英訳を読むといいよ。
スタジオが放火されたことはあんまり関係ないかも。KyoaniとKadokawaは揉めてるけど、Kadokawaは簡単に他のスタジオに委託できるし。ただ、1の理由でやりたくないだけなんだろ。
あと、2シーズン見た後はDisappearanceも忘れず見るんだぞ。
アニメっていうのは、最後まで忠実にアニメ化されるってよりは、ラノベとか漫画シリーズの広告として使われることの方が多いんだよね。パッと思いつくだけでも、俺が見た中で絶対アニメで完結しないだろうなって作品は、Grimoire of Zero、86、Kemono Jihen、Drifters、High School of the Deadとかかな。有名どころ以外は、まあ、S1を楽しんでくれって感じだね。
いや、そうじゃないよ。全10巻のうち4巻だけだよ(アニメ化されたのは)。
IPはたぶんもうダメだろうね、無期限休止中だし。
Tanigawaが数年前に新しい巻を出したよ、前の巻から10年くらい経ってからだけどね。でも、やっぱり昔ほどの人気はないだろうから、新しいアニメはありそうにないかな。
一番最近のラノベは13巻で、2024年の11月に出たんだよ。俺の本棚にあるけど、まだ読めてないんだ(一番空いたのは11巻と12巻の間で、正直11巻の終わりでシリーズ完結のつもりだったんだろうと思ってた)。
最近のアニメ経済がどうなってるかは分からないけど、ストリーミングでかなり変わったと思うね。
今でもやけに修正が明らかなBlu-rayリリースはしてるよ。俺の勘だと、フィギュアとかグッズの市場も、2000年代初頭よりずっと大きくなってると思う(Haruhiのおかげもあるかもね)。3Dとか高品質な印刷、精密なデジタル工作技術が大きく貢献してるんだろうな。
サンキュー、去年また新しいの出してたなんて知らなかったよ!
ストリーミングサービスが業界を変えたんだろうね。Devilman Crybabyみたいなのは、Netflixが関わってなかったら出なかっただろうし。
これ、Neon Genesis Evangelionのプロモーションイラストで試してみたよ。モデルはかなりうまく動くけど、頭を振る時の髪のアニメーションに時間的なアーティファクトがちょっとあるね。
https://goto.isaac.sh/neon-anisora
プロンプトは:The giant head turns to face the two people sitting.
あ、もっと例があるドキュメントページもあるよ。
https://pwz4yo5eenw.feishu.cn/docx/XN9YdiOwCoqJuexLdCpcakSln…
リンク壊れてるみたい
論文だと2~8秒の可変長学習で720p動画作れるって。FramePackと比較してほしいな、あれも2Dアニメ結構うまくいくし duration制限ないんだよね。
https://lllyasviel.github.io/frame_pack_gitpage
オープンソースって言うけどコードとか重み見つからないな。
でもめっちゃすごいね! AniSoraって名前どうなんだろ、まあ分かんないけど。
サンキュー!
>このモデルは1つのファイルが安全でないとスキャンされました。 testvl-pre76-top187-rec69.pth
うーん、これクリアされるまで待った方がいいかな?
チェックポイントがマルウェア配布に使われるって話聞いたことあるな。 BilibiliのIndex Teamみたいに有名なら誤検知だろうけど、念のため使わないかな。
safetensors形式がみんな使うべき。生のpthファイルとかpickleファイルは業界から消えるべきだよ。悪い形式だ。
SD.NextのDistyがdiffusers形式バージョン作ったよ!
https://huggingface.co/Disty0/Index-anisora-5B-diffusers
ちなみに、SD.Nextのdevブランチ(https://github.com/vladmandic/sdnext)はもうサポートしてるよ。
モデルの重みのエントロピーとかサイズが統計的な誤検知をよく起こすのかな?
.pthファイルには実行できるPythonコードが含まれてるかどうかに関係してると思うよ。だって.pthファイルって通常はpickleされたPythonオブジェクトで、読み込む時に任意のPythonコードを実行させられるように操作できちゃうからね。
”AniSora”って呼ぶのは賢明じゃないかも、でも分かんないな。OpenAIが”Open”って名乗ってるんだから、彼らの名前を使い回すのは最高に面白くて良いと思うけどね。去年の今頃OpenSoraってのもあったし、他にも”Sora”って名前の製品たくさんあるしさ。OpenAIが最近sora.comをsora.chatgpt.comにリダイレクトしたのも興味深いよね。
OpenAIが最近sora.comをsora.chatgpt.comにリダイレクトしたの、多分クッキーを共有するためでしょ。
クッキーってマジで面倒くさいよね。クロスドメインクッキーが必要なのにさ。Googleがそれを無くしたのは、自分とこの分析と広告プラットフォームをもっと強くするためだよ。独占禁止法違反じゃん。
認証はOAuth2を使うんだよ。セッションはファーストパーティークッキー。ドメイン跨ぐのはAPIと署名付きトークン(JWT)を使えばユーザーデータ漏らさずできるじゃん。サードパーティークッキー無くなって困ってるのは、進化しなかった広告系の奴らだって俺は思うけどね。
OpenAIはこれ全部使ってるのに、それでもドメイン変えなきゃいけなかったんだよな。あとさ:技術ってもっと簡単になるべきで、難しくしちゃダメなんだよ。これ作るのに1時間もかからないはずなのに、なんでか自分で難しくしちゃったんだよな。
一番最初のサンプル動画でもglitchがいっぱいあるね。シャツの腕がバグってるし、動いてた髪が消えたり急に出てきたり。他はただ腕と雲が動いてるだけだよ。
AIアニメコンテンツ作るのに興味あるなら、AniGenコンペティション参加してみたら? https://komiko.app/anigen-competition
もっとコメントを表示(2)
魅力的な話だけど、急がなきゃね。提出は5月20日が締め切りだから!
色んなアカウントとか色んな入力試したけど、毎回エラーが出て失敗したよ。
こういうサービスで作ったクリップの著作権ってどうなるの? 保護されるの?
今の見解はこれ:https://www.copyright.gov/newsnet/2025/1060.html
”生成AIの出力は、人間の作者が十分な表現要素を決めた場合に限り著作権で保護される”って結論づけてる。
もし保護されないなら(だって絵を描いたのはAIだし)、こういうサービスで映画作った人はマジで困るよね—誰でもコピーしたり、キャラを使ったりできちゃうから)。
サービスが著作権のある素材で学習されたかどうかの問題はここでは置いておくね。
画像をアップロードするにはアカウント作成が必要なんだね —> なんでログインしないとフォームを隠すようにもっと分かりやすくしないの?
同じキャラを違うシーンやアングルで描写できるの? これ、今までの画像生成AIの大きな限界点なんだよね。
『The Beginning After the End』の戦闘シーンが、このツールを通したらどう改善されるか見てみたいな。
真面目な話、これ全部どこに向かってるんだろう? 長い目で見たら、好きなフランチャイズが続きを作るためなら、ビジュアルの粗さにもっと寛容になるのかな? それとも、3Dモデルの露骨な使い方みたいに、生成された映像は敬遠されるのかな?
Toei Animationは、ストーリーボード、彩色、中割り、背景にAI活用を検討中。具体的な用途は、ストーリーボードのレイアウト、色の自動修正、線画修正と中割り生成、写真からの背景生成など。
出典: https://www.japannihon.com/toei-animation-discusses-ai-use-i…
これは良いね。監督が品質管理するだろうし、インディーズも作品を作りやすくなるだろうから。
このツールがこのメディア/ジャンルで何も新しいものを示してないのに、ここでその影響について議論してるの? 使ってみたけど、やっぱり動画生成AIの同じ落とし穴があるね。ダイナミックなアクションの連続を扱うのが最大の課題で、特に戦闘シーンが多いアニメではそう。ダメだったよ。非オープンソースのモデルでも、ほとんどの場合うまくできてないんだ。
探求心旺盛な人たちは知りたいだろうね!
でも真面目な話、私も同じこと考えたよ。高名な中国製生成AIモデルには一般的なガードレールがないことを考えるとね… いつか誰かが答えを知るだろう… 避けられないことだよ…
私はこれを歓迎する。無限のアニメMVやコンテンツにワクワクしてる市場は大きい。これでみんなアニメアーティストになれるだろう。
日本はAIを受け入れており、AIブームとJevons paradoxで新しい仕事と大きな需要が生まれるだろうね。
これがオープンソースならさらに良い。
昔は anime とか mangas 好きだったけど、最近の“anime style”コンテンツは quality が terrible だね。量が多すぎて quality stuff が見えなくなって、 anime みたいな trash ばっかりだよ。
いやいや、 good things は今も作られてるよ。 recent な show の多くは90年代の popular stuff より better ( every regard で: pacing, animation quality, character development, themes, …)だし、今の many live action shows より better だよ。90年代 era の Quality は West だと skewed に見えるんだ。だって limited access しかなくて、 barrier を越えてきたのは outliers だったからさ。 Mother’s Basement みたいな YouTube channels が picking out するのに役立つよ。 Geoff は anime を living で watching してるけど、 worthy な everything を watch するのは still hard って言ってる。「The BEST Anime of [season] [year]」みたいな video titles は self-explanatory だから、 watching したいもの見つけたいなら、 fire up してごらんよ。 plenty of recommendations が nicely ordered で、 short explanation 付きで見つかるよ。https://youtube.com/@mothersbasement/
俺が like する anime の percentage は low だし、 has always been low 。 about every three years に like な new anime が来る感じ( dig する必要はあるけどね)。 In general 、 visuals より writing と story の方が大事なんだ。 AI で a single writer が create できる amount が great increase したら、 well-written sloppy-visuals な anime が more exist するんじゃない? I’m excited to see 。
それは I dislike な anime の何が I dislike なのか identifying することに come down するね。俺は“fanservice”( boob jokes etc.)が I don’t like で、 or at least it to be a signifier of poor quality だと思うんだ。だから animefeminist.com を recommendations に使うよ。それ effective at filtering out ( or at least warning of in advance ) that kind of red flag だし、 seasonal anime の ranking も見れるからね。(この method を使うなら、 their “recommendation,” “digest,” and “three-episode check-in” articles を specifically check するのを make sure してね)。これは enjoyment の chance を about 1% から probably 1-in-15 chance まで improves させるよ。 On average 、 each season には I find is not bad な anime があるけど、 only every 2-3 years or so に I unabashedly love な anime がある感じ。(もちろん、 the site rules out してるけど I really loved な shows もあるよ—— for instance 、 my all-time favourite anime は Attack on Titan なんだ。あれは anifem で blacklist されてる。 someone once wrote an article on polygon about how its overtly pro-jewish anti-fascist allegory is anti-semitic somehow 。 I think that’s a load of bull 、 but probably not enough of a problem for me to stop using this method of finding anime 。)
I think Attack on Titan is a good anime 、だけど I read the allegory as being a Japanese one 、 and in that reading it comes off as somewhat apologist toward fascism 。 I think many readings are present in the work and more besides can be read into it 、だから I don’t claim that any interpretation is right or wrong 、 because that would probably involve spoilers 。 Have you seen Psycho-Pass ? I wonder what your site has to say about it 、 as it seemed kind of a feminist work to me 。 You might find this site interesting : https://cyberfeminismindex.com/
I love Psycho-Pass 、 it’s a classic Urobuchi 。 Can’t find a proper review on the site though 、 likely since it predates the site’s launch 。( They’re doing reviews of previous years as well 、 but slowly 。) Regarding the Japanese interpretation of the allegory — I don’t think it’s apologist toward fascism really 、 because essentially every side in the conflict has fascist elements 。 In that sense 、 it’s more “ some situations just don’t have any good solutions. ” But what’s clear to me is that the situation itself has fascist roots 。 Regardless 、 the Polygon article in question has a much more surface-level reading — it is clearly stating that it’s antisemitic 、 which I simply can’t see at all 。 Spoilers : vg’f gehr gur gvgnaf ner ~wrjf, ohg guvf vtaberf gung gurl ner gur perngvbaf bs ~anmv rkcrevizragf, naq nyfb gung nyy gur cebgntbavfgf ner ~wrjf nf jryy.
I don’t understand what I’m looking at with the site you linked 、 but I am intrigued 。
俺は Attack on Titan を WW2 中の Japan が自分をどう見てたかの allegory って読んでるよ。 Manchuria とか China の mainlanders とは違う特別な racial heritage を持ってるって考え。この優越感が1937年からの coal とかの natural resources 奪取の justification に使われたんだ。こう見ると、 Japan がやった human experiments とか atrocities の apologetics にも見えちゃう。でも、 show の fascism は全部 past の出来事で、その echoes と aftereffects が backstory になってるって感じもするんだ。戦争と empire の子供たちが fear を overcome しようと戦って、自分の past を知る shame (戦争の losers じゃなくて、 dreaded してた death そのものになった human experiments として)を描いてる。
cyberfeminismindex.com について: interactive bibliography with commentary みたいな感じだよ。 https://cyberfeminismindex.com/about/
https://en.wikipedia.org/wiki/Cyberfeminism_Index
Not my experience - as someone generally not interested in anime I only tend to be aware of the cream of the crop.
And in fact we seem to have a once of a decade alignment of talent (starting in 2023 with Season 1) with Frieren.
This is absolutely correct 。 quality が nose dived so hard in the first three months of 2025 that there wasn’t anything worth watching whatsoever even if you were in the target demographic 。