[B! sample] masahiko_of_joytoyのブックマーク

masahiko_of_joytoy id:masahiko_of_joytoy

タグ

sampleに関するmasahiko_of_joytoyのブックマーク (3)

OpenAIの音声認識モデル Whisperの解説 / Fine Tuning 方法
OpenAIから、かなりすごい音声認識モデル Whisperが発表されました。特出すべき点は、教師付き音声68万時間という、かなりヤバめのデータ量で訓練しており、英語では商用の音声認識システムや人間の書き起こしに匹敵する性能とのことです。社内でも日本語、ブルガリア語、韓国語で試してみましたが、すごい精度でした。日本語の場合、漢字の間違いが多々ありましたが、発音は大体あってそうでした。ブルガリア語は、ロシア語で認識されていました。韓国語は、完璧でした。しかし、Githubに公開されたコードを見てみると、訓練コードが含まれておらず、公開の予定もないそうです。そこで、本記事では、Whisperの解説に加えて、Fine Tuningの方法を解説します。 ※ Fine Tungingを何となくで作成しているので、正確なコードではないです。気付いた点がありましたら、コメントください。全てのコード
masahiko_of_joytoy 2022/12/01
チューニング

sample

whisper
リンク
Simple Tensorflow RNN LSTM text generator
masahiko_of_joytoy 2018/10/27
tensorflow

rnn

sample
リンク
TensorFlow — Text Classification
masahiko_of_joytoy 2018/10/27
tensorflow

sample
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx