指定した音声ファイルを、楽器ごとのパートに分解してくれるソフトです。 音声ファイルをドラッグ&ドロップで放り込むと、該当のファイルを ボーカル ベース ドラム その他(キーボード、ギター 等) ボーカル以外のインストゥルメンタル といった 5 つのファイルに分解してくれます。 処理を GPU(CUDA)で実行することもできます。
日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば
オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
※この記事は、音を再生できる環境で読むとより楽しめます。イヤフォン等がある方はぜひお手元にご用意ください。(もちろん音無しでも楽しめます!) 突然ですが、これらの音を聞いたことはあるでしょうか? 『和太鼓でドドン』 『男衆「オウ!」』 『ドンドンパフパフ』 YouTubeを見ていれば、必ず一度は耳にする音ばかりですね。実はこれらの効果音、すべて「効果音ラボ」というフリー音源素材サイトが提供している音なんです。 「効果音ラボ」は国内のフリー効果音サイトでは最大手と言っても過言ではありません。YouTubeに限らず、ゲームやコマーシャルでも様々な音が使われています。 効果音ラボ トップページ ただ皆さんご存知でしたか? このサイト、創設から9年の間ずっと、たった1人の方が運営しているんです。 さらに、銃声を録音するために海外に行ったり、録音のためだけにヘリコプターをチャーターしたりと、音源を作
自宅で友達と通話をしているとき、歌を歌っているとき、Zoomでミーティングをしているとき、「周りに迷惑をかけていないかな」と思ったことはありませんか? 今回はDIY未経験でも簡単かつ、安価でできる防音室作りに挑戦します! 初めまして! 近畿大学広報室でインターンをしている、理工学部 理学科物理学コース 2年生の中井七海です。 私は軽音サークルに所属しており、ボーカルとしてよくライブに出演しています。そのため、自宅でも歌の練習をしたいのですが、今住んでいる実家ではなかなか練習ができません。というのも、自分の部屋で歌うとよく音が響いてしまい、親に怒られる上に、近所迷惑にもなってしまうからです。 また、私はゲームが好きなため、よく友人と通話しながらオンラインゲームをします。ついはしゃぎすぎて、親に「うるさいで〜あんた電話控えてよ!」と怒られてしまいます。 そこで防音室があれば、自由に自分の趣味が
ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開
商品が多すぎて選べない半年ほど前である。鏡にうつる自分の顔のみすぼらしさに嫌気がさし、スキンケアをきちんとしなければと思い立った。私の顔は全体的にひどかった。仕事帰り、電車の窓にうつった私はいかにも生気がなく、まるで「会社の金を横領してつかまった経理部の中年男性」といった独特の陰鬱さがあった。われながら、この容姿はどうしたものかと情けなくなったのである。できればもう少し、はつらつとした顔になりたい。肌や身体の手入れをおろそかにしてきたツケがきたと思った。それまでも、風呂上がりに無印で買った安価な化粧水ぐらいはつけていたが、きちんとしたケアをしなければと考え、ドラッグストアへ向かったまではよかったものの、私は混乱した。商品の数が多すぎて、何を買えばいいのか見当がつかないのである。 スキンケア用品売り場はまさにカオスであった。化粧水だけでも何十種類もの商品が並んでいる。それだけではなく、乳液、
数あるガジェットの中でも、コスパに優れていて実用的なガジェットというものは意外と少ないです。そんなガジェットのジャンルの中でこの要件を満たすものが「セットトップボックス」と呼ばれるもの。これまでも、Chromecastのクローンのような「Ezcast」や「AppleTV」を買ったことがあります。 ただこれらは使い勝手が微妙だったり、拡張性の面でちょっと・・・しかし、FireTV StickはベースがAndroidという事だけあって、拡張性でも小型なので携帯性にも優れていて仕事でも使えそうです。ということで、使い倒してみました。 ※Fire TV Stickは最近不穏な噂や制限だらけになってきたので、ChromecastやNebula 4Kに自分はお引越ししました。 Chromecastを購入して色々検証してみた Anker Nebula 4K Streaming DongleはFire T
taro terahara @srgmtaro ちょっと、にわかには信じ難い出来事があった。先程、夜の打ち合わせ会場にたまたま居合わせた整体の方。 「ちょっと見せて貰っても良いですか?実は僕、楽器の整体もやるんですよ」 リハで、楽器の調子がおかしいという話をしていた時だった。え、なになに?楽器の整体?どーゆーこと? taro terahara @srgmtaro バーンスリー奏者。人生の半分以上インドの横笛バーンスリーを吹いてます。 控えめに言ってインド音楽馬鹿。ちゃるぱーさと一緒にアフガニスタンの音楽も。srgmtaro.jimdo.com (寺原太郎) note: note.com/srgmtaro srgmtaro.jimdo.com taro terahara @srgmtaro 不安気な顔で見守るみんなの視線をよそに、太鼓の枠や皮をひとしきり撫でたりさすったりして、「どうでしょう
配信 まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。 はじめに まだ手元のパソコンでイベント配信してるんですか?クラウド上でTeamsを利用してOBSで配信した方が楽ですよ。 配信のために高いパソコンや配信機材を買ったり、一人で頑張る必要が無くなります。 また。自宅のネットワーク環境を気にする必要がありません。 これまで手元のパソコンでイベント配信を運用してきて下記のような問題が発生しています。 配信するスタッフの確保問題(ほぼ趣味) 同等の環境を冗長することが難しい そのため当日の交代が出来ない イベント運用側としては頭の痛い問題です。 要は手離れができないです。 これらを解決する方法としてクラウド上のIaaSを利用しスタッフ共同運用を行えば解決できると考えています。 配信している方の一部には、��でにクラウド上から配信を行っ
骨伝導ヘッドセットAfterShokzを使い始めて1年以上。 もう完全に手放せない。 メガネと同じくらい装着しっぱなしの生活になっている。 骨伝導ヘッドセットを使い始めて1年 1年ほど前に骨伝導ヘッドセットの記事を書いた。 この時は使い始めて1ヶ月の時点だった。今回はさらに1年使った感想である。まずは前回の復習から始めよう。 俺が使っているのはワイヤレスの骨伝導ヘッドセット『AfterShokz Air』である。 AfterShokz Airオープンイヤーワイヤレス骨伝導ヘッドフォン、ポータブル収納ケース付き、ミッドナイトブルー AftershokzAmazon 骨伝導なので、常に耳は開放状態となる。外部の音も普通に聞こえるし、着けっぱなしでも外耳炎になるリスク*1も無い。 Msahid manik / CC BY-SA, Link この特徴のおかげで1年前 (使用1ヶ月) の時点で、平日
◆◆◆ 「確率的に確からしい」という言葉を続けるロボット ――最近、ChatGPTという言葉をよくインターネットで目にします。なんとなく「こんなことができるのかな……?」というイメージは湧いているのですが、具体的なサービス内容を簡単に教えてもらえるでしょうか。 深津貴之氏(以下、深津) 一言で言えば「人間の言葉で質問すると、人間の言葉で答えてくれるロボット」です。 例えば、質問に答えてくれたり、相談に乗ってくれたり、長文を要約してくれたり……。これまでの“検索”とは違って、人間的な知性があるかのように“文章で返答をしてくれる”のが大きな特徴というサービスですね。 お昼ごはんについて質問したときの回答。これまでの“検索”とは良くも悪くも勝手が違うことがよくわかる これはAIに大量の単語を学習させることで、「直前の単語に対して、最も可能性が高い次の単語を予測している」んです。例えば「むかしむか
ASHIDAVOX® アシダ音響㈱ 🔊🎧🎙️ @ashidavox 【お詫び】本日のみで約三ヶ月分のご注文を頂き、「ST-90-05」が再欠品してご迷惑をお掛けしてしまい、大変申し訳ございません。 次回入荷予定は今月中旬頃でございます。入荷の際には再度こちらからご連絡させて頂きますので、今暫くお待ち頂ければ幸いです🙇💦💦 2022-02-01 17:57:43 詳しい解説 超高域がうたい文句のハイレゾ時代であります。 最初からワイドレンジで作るのが現代流ですが 最初に「中域を完成させて」そこに高品位の高音と低音をくっつけるのが古典派の考えるワイドレンジ なぜかわかりませんが、古典派のやり方は音に厚みが出る。 つまり完成度の高い中域に高音と低音を足してワイドレンジを作る、アシダ音響は昔かたぎであります。 ただ条件があって中域の再現性がハイレベルでない場合、上下を足してもよくならな
パナソニック ミニコンポ FM/AM 2バンド Bluetooth対応 ハイレゾ音源対応 シルバー SC-PMX90-S パナソニック(Panasonic)Amazon予算3万円で、良い音響環境を手に入れたいと考えた場合、どのような構成を考えるだろうか? 自分は、前の記事に書いたように、USB-DAC+アンプ+パッシブスピーカーを勧めている。低価格ということで、中華オーディオを主に紹介したが、中華オーディオは、アンプにヘッドホン出力がないとか、光デジタル入力がないなど機能面が少なく、目的が複数ある場合、USB-DACとヘッドホン用のアンプ、スピーカー用のアンプを組み合わせる必要がある。そうなると、統一したリモコンでコントロールは難しい。多機能さを求めるのなら、日本メーカーのミニコンポの方が便利だ。 PanasonicのミニコンポSC-PMX90は多機能な割に3万円前後と低価格で一押しのモデ
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
はじめまして。リノベーションデザイナーをしているフジイです。 妻の「狭くてもいいので防音室が欲しい」という一言がきっかけで、約1週間かけて自宅の賃貸マンションに防音室をDIYしました。仕組みさえ分かれば、DIY初心者の方でも比較的簡単に、既製品の約5分の1の予算で製作できるので、時間と根性さえあればとてもコスパのいいDIYです。 「防音室」と言ってしまえばニッチですが、「お隣との防音壁」や「お篭もり用の小さなブース」としても汎用的に使えるアイデアです。 自宅に録音ブースが欲しい人はもちろん、自宅で仕事や作業をする人やビデオミーティングが多い人、お篭もりスペースが欲しい人の一助になればうれしいです。 防音ブースをDIYするキッカケ 2017年に結婚した妻と都内のマンションで生活をしていました。僕はフリーのリノベーション・住宅デザイナー、妻はソロのシンガーでナレーションなどの声を使った仕事を生
ある日、自宅で仕事をしていたら、同僚から「便座が会社に届きました」とDMが飛んできた。 恥ずかしい。プライベートなものをECサイトで買って、配送先を誤って会社にしてしまい、それを見られてしまった(しかも安いモデル)。 そんな私の気持ちを知ってか知らずか、同僚から「風間さん、ついに便座もレビューするんすか?」と追い打ちのDMが来た。 冗談と思ってスルーすべきところだろうが、のせられやすい性格ということもあり、温水洗浄便座を記事にするにはどうすれば良いか、真剣に考え始めた。 弊社の媒体が伝統的に得意としている、同一条件での一斉レビューを行うのは難しい。たくさん便器を用意し、それに便座を取り付け、一つ一つ座って検証していけば良いのだろうが、そんなに便器や便座が用意できない。 ■電源で何か変わるのでは? 蘇る炊飯器の記憶 思いついたのが「電源」だ。オーディオについて詳しくない方のためにかんたんに説
米英ではオーディオブックがそのうちEブックと同じぐらいのシェアになりそうなくらい急成長しているって伝えると半信半疑なリアクションされる。iTunesのプログラムリスト見ればわかると思うんだけど、日本のポッドキャストってほんと貧困、何もないよね…とは思ってたさ。 しかも、オーディオブックを聞いてみることもしなくて「やっぱ紙で読む方が好き」とか断言してる人の多いこと。アタシなんて『ハリポタ』オーディオ版聞いたら読書人生、変わっちゃったよ? 聞きたいポッドキャストありすぎて、積ん読どころか、積んキャスト、時間なさすぎて時々泣く泣く消してるよ? 耳でも本を楽しめる、知識を得られるってことなんだけど? なんでこんなに温度差があるんだろう? スマートスピーカーが普及しないのと同じ理由なんだろうか? で、なんでかなー?って考えてみたんだけど、これがまた日本らしいと言うか、こういう文化のどこが美しいのかね
1月末から全社員を対象に原則テレワークを開始 皆さんこんにちはー! 現在クラスメソッドでは、世界5カ国(日本、カナダ、ドイツ、韓国、インド)、国内18フロアに勤務する約500名の社員の99%が毎日テレワークをしています。そうです、いきなり非日常が来てしまい、そしてそれが日常として定着してしまいました。これは、クラウドの世界の均衡を保つ為に暗躍する超人秘密結社「クラメソ」の知られざる活動の記録である。(ここでUNION SQUARE GARDENの曲が流れる) 社長業とはすなわち意志(WILL)の発信である 私はしがない零細企業の工場長として16年目の社長をしておりますが、創業時から大事にしていることは、「お前は何を考えて何をして何を成すんだ」という意志を言葉にして周囲に伝えることでした。もともとシャイなエンジニアでしたので、カフェとか居酒屋とか休憩室とかでの対面のコミュニケーションや、3ヶ
これまでのイヤホンの常識を抜本的に覆す画期的なイヤホンが開発されました。AIP=Acoustic Innocent Pureというこのイヤホンは、従来の頭の中に閉じた空間の音ではなく、外に広がる非常に自然な音を実現するという、これまでにないbluetooth接続のイヤホンになっています。まさにスタジオモニタースピーカーの響きを再現するイヤホンで、演奏の細かいニュアンスを忠実に再現できる性能を持っています。 見た目もこれまでにない、耳から角が突き出すような不思議なデザインのこのAIP、開発したのは元ヤマハのエンジニアである旭サウンドエンタープライズ株式会社の旭保彦さん。音を聴いた瞬間に「何だこれは!」と感じる、従来のイヤホンともヘッドホンとも異なる自然なサウンドを実現してくれます。またしばらく聴いていても装着感があまりなく、イヤホン特有の疲れをまったく感じないのもAIPの大きな特徴となってい
そこらへんの金網でラジオが聞けた、という記憶 一部のAMラジオ局が今月から暫定的に止まる、というニュースを聞いて思い出したのだ。 以前こどもとゲルマニウムラジオを手作りしたときに、うまく聞こえなくて送信所の近くまで行ったら聞こえたことがあった。で、試しにイヤホンをそこらへんの金網に直接つけてみたらそれでも聞こえたのだ。なんだこれでいいじゃん、となった記憶がある。 この機に、それが本当だったのか試してみたい。 思い出の場所に行く さっそく現地にやってきた。 埼玉県川口市にある、文化放送のラジオ送信所だ。駅から30分歩いてやってきた。 記憶では、ここに見えているあらゆる金属にイヤホンをくっつけたらラジオが聞こえたのだ。金網とか、ガードレールとか。 ちなみにくっつけるイヤホンはこんなやつだ。 クリスタルイヤホンといいます 弱い電流でもうまく音に変換してくれるイヤホンだ。両端がクリップになっている
筆者はUTAUによる波形接続の時代から「その人の声になりきる」技術を試してきましたが、このほど、その中でも画期的と思える技術に出会いました。『Seed-VC』(Seed Voice Conversion)というオープンソースソフトです。 ■AIボイチェンの進化どこが画期的なポイントかというと、高い音質を維持しながら、ゼロショット、つまりファインチューニングをせずに、1秒から30秒までの短い音源を参照するだけで、短時間でオリジナルに近いボイチェンができるところにあります。 以前紹介したDiff-SVCやRVCは、オリジナル音声に近いボイチェンが可能ですが、学習にはそれなりの長さのオーディオデータと高性能GPUによる処理が必要です。
手頃な価格で質のいいヘッドフォンを探していたところ、レトロなデザインのこちらを発見! かなりの人気商品らしく、2ヶ月待ってようやく入手することができました。 老舗メーカーが作った高音質ヘッドフォン アシダ音響「ST-90-05-H 灰色」6,600円(税込) ※メーカーサイト価格 創業80年を超えるアシダ音響は、ミュージシャンやエンジニアなどプロフェッショナルも御用達の音響機器メーカー。 中でもこの「ST-90-05-H」というモデルは、一般ユーザー向けに国内生産にこだわって開発された高音質ヘッドフォンです。 人気の秘密は、なんといっても価格帯に見合わない音のよさ。 Φ40のドライバユニットに1テスラ(理論値)の磁気回路を搭載するという高級ヘッドフォン顔負けので仕様で、パワフルかつ繊細で豊かな音質を実現しています。 リーズナブルなイヤホンやヘッドフォンには音域のいずれかに不得意な部分がある
今使っているワイヤレスイヤホンのEdifier NeoBuds Proが2021年に出た製品でちょっと古めになったので新しいのが欲しいと思い、情報収集をしていた。入門記事で、あまり触れられていないことがあったのでまとめておきたい。 現在、Amazon新生活セールFINALでセール価格になっている製品が多いので、気になる製品は価格をチェックして欲しい。 LDAC接続は再生時間が短くなる ワイヤレスイヤホンの再生時間は初心者にはわかりにくい。10時間以上の再生をうたうものはバッテリーケースを使っての充電を含めての場合を言っているものがほとんどだ。*1更にイヤホン本体のみの再生時間はノイズキャンセルON/OFFと使うCODECによって変わってくる。 「LDAC接続は高音質」みたいなことはよく書かれるのだが、この再生時間がかなり短くなることについては触れられていないことが多くて罠だ。ハイレゾのCO
「ガルパンは騒がしい内容なのに全ての音がはっきり聞こえる」──聴覚障がいのアニメファンが語る岩浪音響監督の丁寧すぎる仕事っぷり 2020年3月、あるツイートが話題となった。 聴覚障がい者であるくらはしさんが、アニメ音響監督の岩浪美和さんの手掛けた作品がいかに聞きやすいかを記したものだ。 岩浪音響監督は「サイコパス」シリーズ、『ガールズアンドパンツァー』、『ソードアートオンライン』、「ジョジョ」シリーズなど、数多くの人気作を手掛けている。 聴覚障害者としてアニメの声の聞き取りやすさをメモしているんですが、PSYCHO-PASS 3の聞き取りやすさは神レベルで、無線声、ささやき、室内残響の演出でもほとんどすべて聞き取れる。 音響監督は岩浪美和さんという方で、担当作品を調べてみたら「聞き取りにくかったメモ」に該当なしでした。 — くらはし (@TareObjects) March 27, 202
はじめに 僕は趣味でよくギター(エレキギター)を弾きます。 ですが、長年ずっと困っていたことがありました。 それはギターアンプのノイズです。 多かれ少なかれ、エレキギターを弾くときはアンプからノイズが出るものです。 しかし、僕の家のギターアンプからは明らかに異常な「キーン」というノイズが出ます。 実際どんな音なのかは以下の動画で確認できます。(うるさいのでボリュームには気を付けて!) www.youtube.com このノイズは以下のような特徴があります。 5〜6年前から急に発生し始めた 常時ノイズが出るわけではなく、たまに発生する ノイズが鳴り始めると鳴ったり止んだりを繰り返す ギターを変えても、アンプを変えても同じようにノイズが出る(なので、ギターやアンプの問題とは考えにくい) ギターを全くつないでいない状態でもノイズが出る(なので、ギターのピックアップがノイズを拾っているわけではない
Industry Observerより。 Macで作りました。 BY ネイサン・ジョリー この音は、音楽と言われたもピンとこないほど、すぐにWindows 95の起動音であると分かる音楽の一つです。テクノロジーと自然が融合した天国のチャイムで、6秒以内で収まります。 Windows 95の起動音です。どんな音か思い出せない人は、ここで復習しておきましょう。6秒後に裏で会いましょう。 Windows95の起動音を確認してください。 いいですよね? 作曲として聞いてみると、かなり複雑な音に聞こえます。エーテル的な。完璧に作り込まれています。驚くべきことに、この曲を作ったのは環境音楽の帝王ブライアン・イーノで、彼はMicrosoftの幹部からこの曲を作るように指名されたのです。 音に込めなければならない形容詞が次々と提示されたのです。それが、3.25秒という短い時間であることを考えると、かなり大
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く