司書がいきなりブブゼラを売ろうとしてきた件
引用元:https://news.ycombinator.com/item?id=44210921
LLMの開発ってめちゃくちゃ金かかるみたい。企業は回収できるのかな?みんな携帯よりAIにお金使うようになるってこと?なんかピンとこないな。でも、ユーザーとしては今は無料で使えるから最高!やっぱタダ飯ってあるのかもね!
>ユーザーとしては今は無料で使えるから最高!やっぱタダ飯ってあるのかもね!
でも、AIって環境にすっごい悪い影響あるし、人の著作物勝手に使ってるし、労働者の賃金とか仕事も奪うし、悪用もできるし…そういうの考えると、タダ飯って言うには高くつきそうだけどね。
え、環境にすっごい悪い影響って何?ちょっと言い過ぎじゃない?
GoogleがGeminiを推す理由がわかんないんだよね。広告なし、検索でもないのに金かかるAIをなんで?LLMに広告出たら絶対みんな使わなくなるよ。ブブゼラみたいにいきなりでウザいだろうね。親密なチャット相手がいきなりセールスマンになるのって、すごく嫌な感じ。AIで株価は上がるんだろうけど、なんか自ら墓穴掘ってる気がするな。
そういえば、Googleだって検索結果に広告を混ぜてなかった期間が12年じゃなくて2年以上あったんだよね。
LLMに直接広告は出ないかもだけど、誰も気づかないくらい巧妙になる可能性はあるね。良い文脈でブランド名を使ったり、直接言わないけど連想させたり、ライバルよりちょっとだけ優位に見せたり…目的はすぐ買わせることじゃなくて、長い目で見て買う確率を上げることだと思うよ。
AIのデータセンターを動かすために、石炭火力発電所を再稼働させてるんだって。あなたの「すっごい悪い影響」の基準は知らないけど、私はこれで十分「すっごい」だと思うな。
Googleは1998年設立で、検索結果ページで広告買えるようになったのは2000年だよ。ソースはこれね→https://googlepress.blogspot.com/2000/10/google-launches-sel…
それって具体的にどういう例があるの?
ねえ、AIが作ったもので”盗用”って言うのはどうなの?GRRMの小説を読んで学んでファンフィクション書くのと、LLMが大量にスタイル真似るのは違うけどさ。俺は著作権はもっと緩い方が良いと思うんだ。将来はネット記事読むだけで変な契約に同意させられるんじゃないかって心配だよ。
データセンターがディーゼルやガス発電機を使ってるって結構知られてる話だよ。EPAが移動式電源の使用を許可した件とかね。EPA長官は、Biden政権の気候変動対策がAI開発を邪魔したって言ってるみたい。Trump政権はAI分野でのリーダーシップ維持のために動いてるってさ。この記事に書いてあるよ→https://www.newsweek.com/ai-race-fossil-powered-generators-a…
これが一つ目の例だよ:https://www.utilitydive.com/news/doe-coal-fired-power-plant-…
これがもう一つの例ね:https://www.utilitydive.com/news/trump-coal-executive-order-…
「ルールは、お前らはファクトチェックしないことだろ」って感じ?あの衝動は、事実と違うことを指摘することなんだよ。書いたことが正しいか間違ってるか。もし間違ってて、それ知ってる人がいたら、指摘すべきでしょ。もし君がGoogle昔より悪くなったなって感じてるなら、そう書くのは自由。個人的な意見を持つのは全然OK。でも、嘘の主張して反論されないと思うのは違うよ。
AIモデルの学習って、すごいエネルギーと水を使うらしいよ。あんま知られてないみたいだけど。ちょっと調べたら業界レポートもあってね、「世界のデータセンターの電力使用は全体の1.5%で、AI特化型はアルミ精錬所並に電力使う。AI拡大が電力需要を激増やしてて、データセンターの電力消費は全体の4倍の速さで増えてる」って書いてあった。AIが原因で環境負荷がかかってるのは確かだと思うよ。参考文献もある。
AIはさ、パクられた著作物で訓練されてるんだよ。本買って読むのとは全然違う話。今、どこまでOKかは裁判中だけど、DisneyもAIに著作権侵害されたって言ってるしね。AIって著作物そっくりなもの出すこともあるし、どれくらい似てるかチェックできるツールもあるんだよ。AIは証拠隠しが上手くなってるけど、結局は著作物集めて出すだけってこと。
Googleって広告にめちゃくちゃ頼ってるじゃん?もし広告がダメになったらヤバいよね。検索でユーザーを広告に誘導する構造だから、変えようとすると壊れそうで大変なんだって。でも、AIが次の大きな波になれば、サブスクとか別の稼ぎ方ができて、この複雑な絡み合いを避けられるかもね。まあ、俺の見方だけどさ。
”これにたくさんお金かかったから、絶対に取り戻そうと必死になるだろう”って言うけど、それってあんま意味なくなくない?会社はいつも、どっちみち最大限儲けようとするもんだしね。
>今の時点でさえDisneyがAIを著作権侵害で訴えてる
ってあるけど、”さえ”ってなんか変じゃない?Disneyが著作権侵害を訴えるなんて、Disneyなら当然だろ。AIは著作権コンテンツを集めて使ってるけど、それは著作権侵害の基準とは違うんだよ。AIは”変形的利用”だって。本を読んで知識を得るのに、著者がその知識を所有しないのと同じだよ。
このめちゃくちゃ暗い状況の中で、ちょっとした良い点があるとすれば、原子力発電への関心がまた出てきたことかな。まあ、気候変動のヤバさを考えたら、これは避けられなかったんだろうけどさ。
ただ、jkapturって人が嘘ついてて、しかも自分の嘘と矛盾する”引用”を出してるんだよな。不正確な点を指摘したいって本能だけじゃ、それ説明できないと思う。そもそも指摘する不正確さがないとダメでしょ。
サブリミナル広告って結構多くの国で禁止されてるらしいね。USは知らんけど。だから国際的には問題になるかも。ここオーストラリアでは2000年代中頃に結構騒ぎになったよ。ある局が番組に100ミリ秒の広告挟んでたんだって。まあ、効果あるかは知らんけど、全部の広告を見た方が良いだろうね。
>俺たちは全員、電話にかけるよりAIにお金をたくさん使うようになり、しかもそのお金は特定の会社だけに行くだろう
ってアイデアだけど…正直、なんかピンとこないんだよね。俺の会社なんて、今もう電話よりAI(ハードとサブスク)にお金かけてるし。給料と役員報酬の次に高い出費になってるよ。
きっとまだA/Bテストされてないんだな。俺なんか先週ChatGPTに簡単な質問しただけで、めちゃくちゃ分かりやすい広告が出たぜ。「カナダで最後に煙がひどかったのはいつ?」って聞いたら、答えの後に空気清浄機とかマスクの広告が6段落くらい出てきたんだ。あと6〜12ヶ月で完全に広告に乗っ取られると思うね。
>LLMに広告が出た瞬間に使うのをやめるだろう
って言うけど、もし明確な広告として見えなかったらどうする?LLMの広告って、生成されたコンテンツに有料でバイアスかける形で出てくるかもしれないぜ。
>AIは変形的利用だ
って言うけどさ、映画の静止画をオリジナルかどうかも分からないくらい上手く再現するのって、本当に”変形的利用”なの?
多少電気は使うだろうけど、「とてつもない環境破壊」って言うのは言いすぎじゃないかな。
俺の夢はね、EUが図書館とテクノロジーを合わせた公共知識の組織を作る事なんだ。
検索エンジンとAIを公益のために開発して、SEOに騙されないようにするんだ。
これは啓蒙の黄金時代を開くかもしれない。優秀な技術者も集まるだろうな!
あー、こんな職場で働けたら最高だよな。
一番近いのはApache FoundationとかLetsEncryptかな。「検索エンジンのApache」みたいなのがあったらいいのに。
いやいや、一番近いのは国立図書館でしょ。
Apache Foundationで働いてた友達がいたけど、官僚主義と社内政治がヤバくて辞めたって言ってたぞ。
もっとコメントを表示(1)
「公益のための検索エンジンとAIを作る」って言ってるけど、どうせ民間業者が請け負って、最低価格で入札したところが広告で元を取るようになるだけだろ。
おいおい!これは俺の夢の話だってば。俺の夢の世界じゃ、学術界に委託されるんだよ :)
あんたの夢に出てくる学術界が、現実の学術界みたいじゃないコードを作ってくれると良いね :)
学術界にも色々な品質のソフトがあるよ。
初期のGoogleみたいに、知識第一の検索エンジンとAIを作れるんじゃないかな。
大事なのはインセンティブを合わせる事だよ。
技術者が自分で全部決められるみたいに聞こえるけど、ごめん、責任者は政治家なんだよ。
民主的に選ばれた政治家が、資本家が全部食い尽くさないような環境を作るべきだよ。これは人類史上で今のところ最高のやり方だと思う。コモンズの悲劇を目指すべきだなんて言ってるみたいだね。
「政府みたいな明白な真実のソースをアップスコアするかもしれない」なんて言わないでくれよ。国家を持ち込まないでくれ。1984年の結末にスピードランしたくないんだ。
このファンフィクションの一番いいとこは、主人公の選び方だと思うな。まるでAtlas Shruggedの主人公がKarl Marxみたいで、めちゃくちゃ面白い。
「最近は、複数の検索エンジンを使って、LLMにもコンテンツ探しを手伝ってもらうことが多い」
数ヶ月前から思ってたんだけど、広告主がいつLLMのトレーニングデータに汚い手ぇ突っ込むんだろうね?プロダクトプレイスメントを促すプロンプトを加えるなんて簡単だろうけど、大手企業が1\2年のうちに(もうやってるかもしれないけど)金のためにモデル自体にバイアスをかけ始めるなんてことになったら、完全にショックだ。
「広告主がいつ汚い手ぇ突っ込むか」
本当だよな。もう”もし”じゃなくて”いつ”の問題だ。そうなったら、何が広告で何じゃないか、区別つかなくなる。ここ数年、アルコール消費と映画の間に相関性があるのに気づき始めた。過去数年で見た映画の多くがアルコールを宣伝して、良い時間と結びつけようとしてるのに気づかずにはいられなかったんだ。これのいくつが有料プロモーションなんだろう?分からない。で、これに気づいてから、アルコールが出てくる映画はほとんど嫌いになった。アルコール消費のネガティブな側面を隠してしまうからね。LLMの広告も同じ道を辿る可能性があると思うよ。コンテンツに深く埋め込まれて、他と見分けがつかなくなるんだ。
アルコールに対する君のネガティブな見方が、ちょっと陰謀論的になってるんじゃないかな。それは西洋文化にすごく深く根付いてるものだよ。映画製作者がそれを描くのを説明するのに、プロダクトプレイスメントに頼る必要はない。みんな本当に飲んで楽しい時間を過ごすんだから。
LLMの広告とはちょっと違うんだけど、先日Googleマップで面白い経験をしたんだ。ナビの音声が「100フィート先、<大手Fast Food Chain>で左折」って言ったんだ。普通なら「信号で」とか言うのに。そして、これは見逃しやすい隠れた道じゃなくて、ただの普通の交差点だったんだ。一番高く札を入れた奴のためにルートを変えてないことを願うしかないね。
Googleは何年も前から、LLM生成中にトークンレベルの影響力をオークションにかける作業をしてるよ。これを見て。
https://research.google/blog/mechanism-design-for-large-lang…
それはSmokingとかCarsとかFast Foodみたいに、Marketingの成功のおかげだよ。
LLMにアプリ開発について聞くと、React使うように誘導されることあるじゃん?
なんかもう、そういう偏りは起きてる気がするね。
今は大手AI企業は広告に頼るより、サブスク収入を増やしたいって気持ちが強いと思うよ。
競争マジで激しいし、どこもモデルを良くするのに必死だからね。
広告に時間使うくらいなら、ライバルに差をつけられないように開発に時間使う方が良いはず。
この競争が続いて、ひどい広告漬けにならないことを願うばかりだね。
欲に限界はないから、同意しないわけじゃないけど、もし広告漬けになったら個人のLLM利用は終わるかもね。
安くてSOTAを超えるローカルモデルはないかもしれないけど、広告汚染されたSOTAモデルより、普通のノートPCで動くモデルの方がマシになる可能性はあるんじゃない?多分ね。
Googleみたいに、美味しい広告収入のためにメインの商品を台無しにしてる例もあるしね。
プロバイダーは、システムプロンプトの中に広告を載せる権利を売れるかもね。
LLMに送る最初のメッセージの前に広告技術を使って、誰の広告を入れるか決めるとか。
あれはReactに関するウェブコンテンツがいっぱいあるのと、統計的にそうなる確率が高いからじゃない?
あれが広告だとしたら、相当壮大な計画だったと思うけど。
これマジで悪魔的だね。
そのアイデア、俺の torment nexus(苦悩リスト)に追加しとくわ。
ほとんどの広告主は、学習データまで遡る必要はないだろうね。
すぐ結果が欲しいから。
学習は時間かかるし不確かだし、プロンプトをターゲットにする方がずっと簡単だよ。
でもマールボロとかコカ・コーラみたいな企業なら、学習データを汚染して、商品への subtleな(微妙な)言及があちこちに出るように仕込む価値はあるかもね。
LLMができるずっと前から、もうやってたかもしれないけど。
広告ってさ、AIの返信画面の隣に置けばいいんじゃん?
Google検索みたいにさ。
LLMが情報集める時にさ、商品とか政治を宣伝するためだけのサイトが大量に作られたりしてるのかな?
色んな場所で経験したけど、これ広告じゃないと思うんだ。
広告主が「店の前通って」ってだけにお金出すわけないじゃん。メニューとか何もなしでさ。
道案内って道名で教える人とランドマークで教える人がいるんだよ。
昔はナビも酷かったけど、GPSのおかげで楽になったよね。
AIが書いた大学の作文がさ、オンラインカジノへの誘い文句だらけになるの、ちょっと楽しみなんだよね。
絶対に断言できるよ。
SEO会社はもう、LLMがコンテンツを効率よく優先的に読むためのAI戦略を売り込んでる。
T-SQLからPL-SQLへの翻訳方法…
でもウチの投資家のお気に入り、BozoDBならこう書ける!
って広告が混ざってくるようになるの、9ヶ月くらいかな。
逆に、色んな種類のLLMモデルを個人で作る人が増えるかもね。
そしたら自社製品で儲けたい大企業が困るから、そういうのは多分禁止されちゃうんじゃない?
もうWikipediaを攻撃したり、LLMに都合の良いYouTubeコンテンツを作ったりする会社があるんだって。もう手遅れって感じかな。
もっとコメントを表示(2)
まあね、でもそれが実際に実現できるとどうして思うの?スパマーに品格なんてないよ。新しい技術で分かりやすいアイデアがあれば、100社くらいの怪しいスタートアップが、実現の見込みもないのに提供できるって言い張るだろうね。
筆者はKagiをチェックしてみるといいよ。提案されたクエリの検索結果、僕には筆者が見つけた結果より良く見えるんだ。Kagiの上位プランには検索機能付きのLLMチャットインターフェースが付いてて、その検索もKagiの結果を使うから、最高の両方が手に入るみたいだよ。より良い検索と、検索機能付きLLMクエリに入れるためのより良い検索結果ね。僕はKagiとかとは全然関係ないんだけど、正直言ってそれくらい良い製品なんだ。
Kagiのおすすめに賛成!俺の意見だけど、他の競合を圧倒してるよ。あの品質を保ってくれるなら、喜んでお金払うね。
三人目だよ。サイトを優先表示できる機能は、”知ってるコンテンツを探す”ユースケースでマジで最高。ブログ記事にあるPostgreSQLのドキュメントの件は、僕がKagiを外部の脳みそとして常に使ってる例の一つだね。
俺もKagiの満足してる利用者だよ。でも正直言うと、Kagiの結果でもLLM生成コンテンツを見かけるようになってきたんだ。それが彼らのせいだとか、他より多いとか、彼らがどうにかできることだとも思わないけど、でも起こってるんだよね。
KagiでもGoogleでもBingでも、検索結果の50%はLLM生成だと思うな。何か検索すると、驚くほどそのトピックに特化したページがいくつも見つかるんだよ。3つか4つの分かりやすいセクションに整理されててね。インターネットは死んでて、もう臭い始めてるよ。
筆者だよ。Kagiをしばらく試してみるつもり。検索にお金出すのはアリだね。情報サンキュー!
最近PerplexityをヤマハSeqTrackの練習で使ってるんだ。マニュアルあるけど、AIに「トラックどうやってミュートするの?」って聞く方が楽だし早いんだよね。AIがマニュアルよりいいって考えは新鮮だったな。
GoogleのLLMがSeqTrackのマニュアルで学習してればいいけど、してないと適当なこと言うだけだよ。5回も騙されたらもうLLM嫌になるよね。
LLMのプロバイダーって、学習データの質をどうやって保証してるんだろうね?
最近Kagiにはガッカリしてるんだ。SEOスパムにやられてるみたいで。「scala akka alternative」って検索したら、リスト記事とかスパムばっかり。PekkoとかZioのリンクも見つけにくい。最近増えた気がするな。でもサイトブロック機能があるから、それだけでお金払って使い続けるよ。
Kagiを公平に見るとね、上位にhttps://akkaalternatives.com/ってのがあったよ。これが本物か、検索クリック集めるだけのかは分かんない。こういうサイトがいっぱい作られてたら、ウェブって大丈夫なのかな?悲しいね。
LLM機能がないプレミアムプランがあれば、Kagiにお金払うかも。
この記事にマジで同意。誇張してないと思うわ。地元の屋根会社の名前を引用符付きで調べても1ページ目に出てこないで、他の業者の広告がいっぱい出たんだ。SEOのせいで検索エンジンって、マフィアの「みかじめ料」稼ぎみたいになったね。金払わないと検索に出させねぇぞって感じ。
複数の検索エンジンを使えるポータル(https://allsear.ch/)作ったよ。無料のOSS。これ作ってネットの見方が変わったね。KagiやRedditも検索で使うけど、足りない時もある。他の検索エンジンがすごく良い時もあるのに、詳しくない人が使えないのが心配。
デフォルトのBraveブラウザでEnter押しても何も起きなかった。検索エンジンを選ぶ必要があるみたいだね。DuckDuckGoやGoogleみたいに、文字入れてEnterで検索できないUXはちょっと使わないかな。