無料で名作が聞けるLibriVoxってどうなの?
引用元:https://news.ycombinator.com/item?id=44153738
無料で名作が聞けるLibriVox以外に、Lit2Goっていうサイトもあるよ(https://etc.usf.edu/lit2go/books/)。ここはLibriVoxより数は少ないけど、プロが選んで録音してるから質が高いんだ。例えば、子供と一緒にロレーヌ・モンゴメリーさんの『Curly and Floppy Twistytail』シリーズ(https://etc.usf.edu/lit2go/183/curly-and-floppy-twistytail-t…)をすごく楽しんだよ。全部が子供向けじゃなくて、『Dracula』とか『David Copperfield』みたいな大人向けのも質の高い録音であるんだ。
うわー、HN(Hacker News)でFCIT/Lit2Goの名前を見るなんて思わなかった!昔Lit2Goのサウンドブースで働いてたんだけど、一番好きだった仕事の一つなんだよね。素晴らしい声優さんがたくさん来てたし、録音やミキシングの知識はそこでほとんど学んだんだ。プロジェクトを仕切ってた人たちは聖人レベルで勤勉で真面目だったよ。彼らのオープンソース画像サイトには歴史的なステレオビュー写真がたくさんあって、3Dメガネで見るのがいつも楽しみだったな:https://etc.usf.edu/clippix/search?q=stereoview (この検索結果よりずっとたくさんあったはずなんだけど、まだあるといいな…)
エリザベス・クレットさんの朗読はマジで神がかってるよ。今まで買ったどんなプロの録音よりもずっと上。LibriVoxの検索ページで読者名で検索できるよ→https://librivox.us/search.jsp?search=reader%3A%22Elizabeth+%22
僕のお気に入りの小説、H. Beam Piperの“Little Fuzzy”はパブリックドメインなんだ(作者が遺言を残さずに亡くなって、ペンシルベニア州が著作権を更新しなかったから)。
これのタビサットさんによるプロ並みの朗読があってね:https://librivox.org/little-fuzzy-by-h-beam-piper/
これはマジでおすすめだよ。ただ、残念ながらLibriVoxの朗読の質ってかなりバラバラなんだよね。長旅で家族と聞こうとしても、質の悪い録音だと嫌がられることも多かった。そうはいっても、仕事中の退屈な作業の時はスマホのアプリで聞いてるし、このプロジェクトにはすごく感謝してるよ。
まさに、FOSS(Free and Open Source Software)で“Netflix n chill”をやろうとするようなもんだよね。最高の技術プロジェクトが一般人には使いこなせないってのは悲しいことだよ。
>残念ながら、朗読の質はかなりばらつきがある。。。
大学時代に教授におすすめされてLibriVoxを聞いてみたんだけど、難しい詩を聞こうとしてたのに、試した録音のほとんど全部でひどい破裂音(plosives)があって、全然聞けなかったんだ。耳が耐えられなかったよ。
Coleridgeの”Kublai Khan”は色んな朗読者が読んでるバージョンがあって、自分に合う人を見つけるのに良いよ。みんながボランティアで時間とエネルギーを提供してくれてることに感謝してるし、一人しか朗読者がいない時でも受け入れてるよ。
このプロジェクトとその貢献者に本当に感謝してるよ。いつか母語で本の朗読をして貢献したいな、って思ってる。母語はゆっくり消滅しつつあるから(話者1000人未満)、それを保存する手段になると思うんだ。
”これはLibriVoxの録音です。全てのLibriVoxの録音はパブリックドメインです…”って冒頭部分、覚えてるよ。何年も前にLibriVoxのRobert Lyndプロジェクトに貢献したことがあるんだ。(Lyndは素晴らしいエッセイストだよ、興味があれば)。
本はいつもパブリックドメインだって知ってるよ。録音もパブリックドメインなの?それともGPLみたいなフリーライセンスなの?
全てのLibriVoxの録音はパブリックドメインだよ。詳細はここを見てね: https://librivox.org/pages/about-librivox/
Sherlock Holmesの朗読だよ: https://librivox.org/the-adventures-of-sherlock-holmes-versi… 。David ClarkeはSherlock Holmesの話をたくさん朗読してて、すごく上手だよ。
AIは LibriVox プロジェクトにとってプラスになるのか、それともマイナスかな。高品質なオーディオブックがたくさん増える可能性はあるけど、プロジェクト本来の精神には反する気がするんだよね。
このプロジェクトで集められた音声データは、10年以上前から自動音声認識や音声合成システム (LibriSpeech, LibriTTS, LJSpeech とか見てみて) の構築に使われてきたんだ。間違いなくAIにとって benefit になってるよ。
彼らが言ってるのは、AI が LibriVox に与える影響、つまり ebook をAI TTS ツールにかけてアップロードする人たちのことだと思うんだ。
うまく編集された AI 録音は great かもしれないけど、たくさんの人がAI slop (校正なし、チェックなし、ただ怠慢なだけ) をアップロードしようとするんじゃないかな (ポリシー知らないけど)。
高品質な Free audiobook を作る目的で考えれば、human-generated な録音も AI generated な録音も、問題は本質的に同じだと思うんだ。録音品質と原文への忠実さ(内容面も、トーンや感情表現といった適切な読み方も)は確認が必要。
問題は scale だね。human-generated なものより、TTS generated なものがはるかに多くアップロードされるだろうね。悪い slop をすぐに捨てるための自動フィルター(例えば ASR WER や audio quality metrics)は最初の great なステップになると思うよ(本物の人間のなまりのある speech には unfairly penalize かもしれないけど)。
重要なのは、録音が human か AI generated かを示すべきだということ。
> 重要なのは、録音が human か AI generated かを示すべきだということ。
これだけで十分だよ。mediocre な TTS で全然OKな時もあるし、actual professional がいい時もある。LibriVox はその midway だけど、amateur human なのか robot なのかはっきり specify すべきだね。
反対だな、あなたが返信した人が述べた理由でね。
historically には、音声録音が AI generated だと言われれば basic な TTS の robotic voice を期待すればよかったけど、AI voice generation の advances によって、AI が real human と同じくらい good に聞こえる point に近づいてるんだ。professional reader と同じくらい good な audiobook を生成するのはまだそこまでではないけど、その point はそんなに遠くない将来に来るだろうね。
確かにTTS は modern AI のおかげで lot improved されたけど、fluently に words を reading する beyond は単純に information を持ってないんだ。professional audiobook reader は narrative mood を反映するために tone を modulate するし、character の nature に合った voice を選ぶけど、transformer model はそういうことができないんだ。
professional audiobook の example として、Rob Inglis の The Lord of the Rings version を check してみて。
current stage については君に agree するよ。だから AI が professional reader に match する point にはまだ not yet って言ったんだ。
でも、”it simply doesn’t have the information to improve beyond sounding like a human reading words fluently” って君が書いたところには disagree だな。人間と同じように reading する時に same information を持ってるってことだよ。
君はこのことについて僕より optimistic だけど、君の perspective はわかると思うよ。decent な sentiment analysis、fluent な text generation、real-sounding な TTS があるから、これらを combining すれば pretty good な reading になるだろうね。newspaper columns や magazine articles に関しては君の言う通りだと思うけど、それは good audiobook の level ではないよ。
例えば The Fellowship of the Ring の iconic line を挙げるね。
> The wizard swayed on the bridge, stepped back a pace, and then again stood still. ‘You cannot pass!’ he said.
YouTube Shorts や videos(最近ますます増えてるね)の AI voice overs には very annoyed なんだ。AI だと気づいたら tab を close してるよ。いつまでこれができるかな。
AIの声がAIだと気づく割合が10%以下になるまで、もうちょっと待てばイライラすることも少なくなるんじゃないかな。
きっと、色々な障がいがあって、オーディオブックで生活がすごく楽になる人もいると思うんだ。
そういう人たちは、正確なら人間でもAIでも、何でもありがたいと感じてるんじゃないかな。
将来はそうなるって期待したいけど、今のところTTSで作られたオーディオブックは、まだ不気味の谷問題がありすぎて、高品質とは言えないと思うんだ。
記事とか専門的な文章ならたまに聞けるけど、質の高いナレーターは、キャラごとに声を使い分けたり、複雑な感情を表現したり、文脈を読んで微妙なニュアンスを伝えたりできるよね。
これは今のTTSモデルにはかなり高いハードルに見えるな。
NotebookLLMみたいなのは最初は驚くほど良く聞こえるし、いつか人間みたいに上手くなるって希望が持てるけど、1時間くらい聞いてると目新しさが消えて、人工的な感じがすごく鼻につくようになるんだ。
質の高いオーディオブックのナレーターは、キャラごとに一貫した特徴的な声を使ったり、複雑な感情を理解したり、文脈の手がかりや裏の意味に反応したりできる。
俺が今までで一番良かったオーディオブック体験は、John le Carréが自分の初期の小説を朗読してるやつ(著作権保護期間中)。
彼はキャラごとに違う声を使ってて、それがすごく生き生きしてて息をのむほどなんだ。
情報ありがとう!
ナレーションが良いオーディオブック大好きだし、しばらくJohn le Carréの本を読んでみようと思ってたんだ。
Audibleで「John le Carré Value Collection」っていう、パナマの仕立屋、われらがゲーム、ナイト・マネージャーが入ってるのを彼が朗読してるみたいだけど、君が言ってるのはそれ?
それと関連して、Frank HerbertのDuneの2007年のノーカットオーディオブック[0]もすごく良いんだ。
Simon Vanceが語りを担当してるけど、他のキャラは別の声優がドラマチックに演じてる。
素晴らしいんだけど、残念ながら少し出来栄えにムラがある。
プロジェクトの3/4くらい終わったところで、元の声優の一部が続けられなくなって、Vanceが穴埋めしなきゃいけなくなったみたい。
それでも、俺のお気に入りのオーディオブックの一つだよ。
[0]: https://libro.fm/audiobooks/9781427201447-dune
俺のおすすめは、彼が朗読した最初の頃の本だよ。
「死者への電話」と「ドイツの小さな町」
ここで聞けるよ:
https://youtu.be/e1lmpG3kCDg
https://youtu.be/30QOqAcY4bY
https://youtu.be/0Ik9Gv9s0TQ
https://youtu.be/q79SspzdpLA
https://youtu.be/i3UnPBMouwU
ちなみに、「Value Collection」に入ってる3冊は抄訳版だよ:
https://www.amazon.com/John-le-Carr-Value-Collection-audiobo…
まあ、Librivoxにあるものは全部AIの学習に使われたと思って間違いないね。
だから、「メリット」か「デメリット」か…君が判断してくれ。
本当に素晴らしいのは、Adrian Praetzellisが朗読したRudyard KiplingのKimだよ。
https://librivox.org/kim-by-rudyard-kipling/
もっとコメントを表示(1)
https://librivox.org/anarchy-by-errico-malatesta/
これこそが進むべき道だ。
前に、ブッククラブで読んでる本のオーディオブックが見つからなくて、長くて読む時間が取れなかったことがあったんだ。
商業出版されてるオーディオブックはなくて、でもパブリックドメインだったから、LibriVoxで見つけたんだよ。
本は長くて退屈だったけど、少なくともナレーションは良かったな。
LibriVoxはInternet Archive経由で寄付を受け付けるようになったみたいだよ。詳しくはここ見てね: https://wiki.librivox.org/index.php?title=Donate
LibriVoxでナレーションがすごく良いオーディオブックをいくつか楽しんだよ。Karen Savageが朗読してるJane Austenの小説とか最高だった。
何年もLibriVox聞いてないけど、毎年2.99ドル寄付してる。恩がある気がしてね。視野が広がるんだ。普通なら読まない面白い本がたくさんあるよ。例えば1800年代のゴーストストーリーとか、人種差別的な『The Leopard’s Spots』とか。一番好きなのは『Havelock the Dane』。14世紀くらいの本だけど、もっと古いかも。作者や当時の読者は航海のことめちゃくちゃ詳しいのがわかる。主人公はConan the Barbarianみたいでシンプル。牛と同じ重さの石を持ち上げて男二人分の距離投げたりするんだ。「やべえ…すごい」って当時の読者が驚いてそう。
Elizabeth Klettも良いよ。
複数のフィルターをかけられるようにしてほしいな。例えばScience Fictionで英語のやつ、とか。キーワード検索も組み合わせられたら良いね。
LibriVoxの全コレクションをOpen Libraryに取り込んでいるわけじゃないけど、Open Libraryでよく記録されてるLibriVoxの本はここにあるよ: https://openlibrary.org/search?q=id_librivox%3A%2A&mode=ever…
ほら、これは良いしすぐ実行できるね。Open Libraryのホームページには俺が言ってるようなのがあるんだ。訪問者におすすめの本とかを紹介してる。
>Librivoxは非営利で広告なしのプロジェクト…文句言う代わりに、寄付でもしたら?無料で提供してくれてるんだからさ。
LibriVoxは、どっかのHNer(Hacker Newsユーザー)よりUX(ユーザー体験)にもっと気を配るべきじゃない?
正直言って、これはかなりイライラするね。お前みたいな人が、製品作りの考え方をオープンソース/パブリックドメインのプロジェクトに持ち込むのは本当に嫌だ。ここの人たちは製品を作ってるわけじゃない。ユーザーも顧客も投資家もビジネスの考慮事項もない。ただ貢献者が時間とお金を寄付してるだけなんだ。
「UX」に集中したくないなら、そうする必要はない。プロジェクトを信じる人がUX向上に時間を使うなら、それはできる。でも、貢献者やメンテナーの誰かが、既存の貢献者に役立たないことをする義務なんてないんだよ。
新しい人を歓迎する上ではそれが良くないのは分かってるし、プロジェクトがアウトリーチしたり、新しいメンバーを呼び込むようにするのは良いことだろうね。そういうプロジェクトもたくさんある。でも、彼らが大量の無料コンテンツを提供してるのに、「もっと何かするのがプロジェクトの義務だ」なんて言うのは、本当に腹が立つ。もしコメントするほど重要だと思うなら、自分で作業しろよ!
これは、俺は「smol bean(小さくて取るに足りない存在)」だからって、README.mdに何の努力もするべきじゃないって言うのと同じだよな。
せっかく自分が努力して作ったプロジェクトなのに、エンドユーザーに少し配慮するのがそんなにおかしいことなの?
彼らは無料でやってるんだ。だから好きなようにする。もしお前がもっと欲しいなら、無料で貢献すればいい(それともお前にはそれすらできないのか?)。もし気に入らないなら、使うな。
”Man, nobody at LibriVox can be bothered to”(LibriVoxの誰も〜しようとしない)って?
お前は何か役に立つものを無料で提供したことあるか? 文句以外で(文句を役に立つと思うなら別だけど)。
俺はいくつかのオープンソースプロジェクトを作ったことがある。そして、ユーザーの多くはお前みたいだ。何も貢献しないくせに文句ばかり言ってくる。無料で与えるだけじゃ足りなくて、自分向けにカスタマイズして欲しいらしい。お前みたいなユーザーのせいで、俺はもう全く気にしなくなったよ。新しい個人的なプロジェクトはオープンソースにしてない。文句を聞かなくて済むようにね。
俺は数千人のユーザーのためにチャリティとして運営しているサービスを含め、あらゆる種類のオープンソースプロジェクトを持ってるよ。
もし人々に使ってもらうものを作るなら、使う人の経験についても考えるつもりだ。READMEを磨くのと同じ理由さ。せっかく頑張ったのに、最後に手を抜くのはなぜ?
それはお前の意見だし、無料で、自由な時間にやってるんだから、文字通り好きなことをする自由がある。俺は、お前のプロジェクトがダメだとか、プロフィールに載せる気もないのかとか、そんなことは言わない。
それはお前が使ってるトーンと大いに関係があるんだ。「素晴らしいプロジェクトですね、Xを加えることを考えたことはありますか?」って言ったなら、何も言わなかっただろうね。でもお前は「Man, nobody at LibriVox can be bothered to」って言ったろ。それは失礼だ。お前がそれに気づいていないらしいってことは、お前がオープンソースをギスギスさせている人間の一人(悪気はないことが多いけど)だってことを示唆してるな。
俺のオープンソースプロジェクトに来て、何かに苦労したからってひどく文句を言ったり、俺に機能の実装を(もちろん無料で)強要したり、ライセンスの変更を迫ったりした例はたくさんある。そして、彼らの行動が毒性があるって言うと、多くの場合彼らは気づいてなかった(謝る人もいれば、嫌な奴もいる)。それでも彼らの行動は毒性があるんだ。
人々が何かを無料でやってくれているときは、少なくとも敬意を持つべきだよ。
いや、これはこれでいいんだよ。これは本質的に図書館の蔵書目録だからね。俺は、他の人が何を読んでるかみたいな押し付けがましいインターフェースより、こういう方が好きだ。だって、俺はこういう目録にアクセスするときは、自分が探してるものを分かってるからね。他の人が何を読んで/聞いてるか知りたいなら、本の推薦サイトやフォーラムに行けばいい。図書館の目録は中立であるべきだ。何があるかだけ表示して、人気争いは他の誰かに任せればいい。
でも検索ボックスとかアルファベット順リストがあるのは、それに興奮する一部の人だけだろ?残りの人たちはどうするんだ?
注目の本とか人気セクションを作るのは基本的なUXで、訪問者がどんな本があるか閲覧しなくても期待できるものを見れる良い「call to action(行動喚起)」になるんだよ。
俺の地元の図書館ですら、ホームページにおすすめセクションをもっとちゃんと作ってるぜ。誰もUXを気にしないとか、「おすすめリストは悪くて押し付けがましい、俺はアルファベット順の方が好きだな」みたいな少数派のHNer(Hacker Newsユーザー)の意見を持つのは、本当に残念だね。
お前のコメントは、ボランティアの努力に文句を言う人たちみたいに聞こえるつもりはなかったかもしれないし、本当に善意で言ったのかもしれないけど…
これをHacker Newsじゃなくて、プロジェクトに直接フィードバックとして提出することを考えたことはある?お前には明白に見えることが、このプロジェクトのボランティアには明白じゃないかもしれないんだ。(あるいは、彼らのフォーラムでこの側面について話してるかもしれない―正直知らないけど?)
敬意を持った方法で、この活動を管理しているボランティアにフィードバックや提案を送ってみたら?そうすれば、彼らがお前の提案を考慮できるかもしれないだろ?
なるほど、そうかもね。コメントした時は結構いたずら心だったんだ。
もしやるなら、ホームページにLibriVoxのおすすめリストをいくつか載せるのはどうかな?
https://www.google.com/search?q=librivox+book+recommendation…
DBクエリすら不要だよ。JS/HTMLに10個くらいリストを持たせて、読み込みごとにランダムに表示する。
数千時間の寄付されたコンテンツに依存するプロジェクトなら、高品質な寄付を宣伝するためにホームページに10分作業するのは大したことない要求だよ。この提案に抵抗されたら、これを思い出させるといいかも。
その機能が必要なら、自分で推薦サイトを作るか、スポンサーすればいいよ。
もしあなたが作ったりスポンサーしたりして、十分な人が必要だと思えば、みんなそこに来るだろうね。
LibriVoxに本当にこの機能が必要だと思うなら、コードを提出するか、コードを実装するための資金を提供することで彼らを説得できるかもしれないよ。
私も同じ意見。彼らのページにはそういうのはいらないな。個人や他の組織が”LibriVoxで良い聞き物”のキュレーションリストを作る方がいいと思う。
”残りの俺たちはどうする?”
彼の/私の提案であなたのニーズは満たされるよ。”LibriVox audiobook recommendations”ってGoogle検索すればいいだけ。
”地元の図書館でさえ、おすすめ本コーナーでホームページにもっと手間をかけてるのに。”
彼らは金をもらってるんだよ。あなたはLibriVoxの人たちに、サイトの良いものを判断する能力を求めてるんだ。彼らにそんな余力がある?(しかもこれは永遠に続くタスクだよ)
このスレッドは、なんでほとんどのサービスのUXがこんなに悪いかを思い出させるね。
ほとんどの開発者はUXじゃなくてMX(My Experience)を考えてる。
あなたは聴きたい本を見つけるためにいろんなサイトに行くのが平気なんだね。だから他の人もその経験を好むべきだと。
それか、週に一度ホームページ用にトップ5リストを出すDBクエリを書くこともできる。あるいは、おすすめ本をいくつかホームページにコピーして、クリックしやすい場所を提供する(良いアイデアだ)。
ウェブサイト訪問者への少しの配慮に対する、この反論の多さが、なぜ良いUXがこんなに稀なのかというパズルの別のピースを明らかにしているだけだ。
前の数コメントでも言ったけど、これはまるで、彼らのGithubリポジトリになぜREADMEがいらないかを擁護するために戦争に行く人たちの話を聞いているようなもんだ。LibriVoxの場合は、他の人が人生の何時間も貢献したリポジトリなのに。
頼むからREADME作ってくれ。数人のボランティアの貢献を宣伝してくれ。
そうそう、MXへの返信の通り。あと—これ(話に乗るなら!)面白いかも、たった3つ変えるだけでね:
”LibriVoxの誰か、”おすすめ本”セクションをキュレーションするか、”人気本”セクションをホームページに作ることを考えた?”
俺たちみたいなランダムなHNコメンターにはぴったりだね :)
Eleven Labsを使ってLibriVoxみたいなものを作れないかな?
確かにEleven Labsはプロのナレーションには全然及ばない(まだね)けど、平均的なLibriVoxの朗読者よりは断然いいよ。
今のところ、問題を金で解決するだけの話(しかもそんなに大金じゃない)、そしてそれはたいてい才能を探すより簡単なんだ。