MacWhisper は私が待ち望んでいた無料の文字起こしソフトウェアです

音声ファイルをテキスト ファイルに変換する Mac ソフトウェアをお探しですか? Otter.ai や Trint などの有料ツールはたくさんありますが、使いすぎると実際にお金がかかることがあります。 しかし マックウィスパー インターネットが待ち望んでいた無料のソリューションです。 または、少なくとも、私が待っていたもの。

OpenAI は 2022 年 XNUMX 月に非常に強力な無料プログラムをリリースし、技術に精通した人々が音声ファイルと動画ファイルを非常に正確なトランスクリプトに変換できるようにしました。 問題は、ターミナル アプリでのコマンドの使用に慣れる必要があるため、平均的なユーザーにとってはあまりアクセスしにくいことでした。

しかし、最初に発見された MacWhisper では、 9to5Mac、誰かが最終的に GUI、またはグラフィカル ユーザー インターフェイスを開発しました。これは OpenAI の Whisper の上に構築され、フードの下にあるすべての紛らわしい技術的なものを残して、オーディオ ファイルをドラッグ アンド ドロップするだけで非常に迅速に書き起こしを行うことができます。 そして、OpenAI の Whisper がトレーニングされているため、MacWhisper は非常に正確です。 680,000時間 Web 上のオーディオ データの。

MacWhisper の優れた点の XNUMX つは、書き起こしたいオーディオ ファイルやビデオ ファイルをインターネットにアップロードしないことです。 これは、機密性の高い記事に取り組んでいる可能性のあるジャーナリストや、自分の個人ファイルをクラウドにアップロードすることに一般的に警戒しているジャーナリストにとって重要です. ファイルはデスクトップに残ります。つまり、誰かがあなたの音声を傍受する可能性はありません。

繰り返しになりますが、MacWhisper は、昨年末に OpenAI によって導入された無料プログラムの新しいユーザー インターフェイスにすぎませんが、実際には、ほぼ誰でも簡単に音声の文字起こしを行うことができます。 私は Whisper を使用しており、リリースされて以来、非常に便利であることがわかったからです。 そして、私もこれからは MacWhsiper を使うつもりです。それは私のワークフローを確実にスピードアップしてくれるからです。

ほんの一例として、仮想通貨会社 FTX の倒産のニュースの後、Whisper を使用して、会社の創設者である Sam Bankman-Fried との数十時間に及ぶ古い YouTube インタビューを書き起こしました。 そこから、トランスクリプトを検索し、記事を書くための奇妙で興味深いアイデアを見つけることができました.2021年XNUMX月にSBFが言ったときのように: ブロックチェーンはエンロンを修正したでしょう. SBF とエンロンの比較は、FTX がどのように崩壊したかについて現在わかっているすべてのことを考えると、奇妙な偶然でした。 しかし、検索できる数十の書き起こしがなければ、古いあいまいなインタビューでその瞬間を見つけることはできなかったでしょう. そして、そのプロセスは、何時間も何時間もテープを聞くよりは簡単でしたが、依然としてぎこちなく、あまり自動化されていませんでした.

自分のマシンに Whisper をインストールしてから、ファイルを書き起こしたいときはいつでも Mac のターミナル アプリに「whisper audiofilename.mp3 —model tiny.en」と入力していました。 WhisperMac では、オーディオ ファイルをドラッグ アンド ドロップするだけで、余分な入力をしなくても魔法のように機能します。

YouTube からダウンロードした NBC Nightly News のエピソードで MacWhisper をテストしました。 また、「windchills」という言葉を「windshills」と解釈したり、レスター・ホルトを「Lester Hold」と聞いたりするなどのいくつかの誤りを除けば、トランスクリプトは非常に正確でした。 MacWhisper は無料ですが、OpenAI のより集中的なトレーニング モデルを使用するため、わずかに正確なソフトウェアの有料層がありますが、無料版はほとんどの人にとってうまく機能します.

MacWhisper では、平文、CSV、または SRT や VTT などの字幕ファイル形式など、いくつかの異なる形式で転写された単語をエクスポートできます。

MacWhisper は英語だけのものではありません。 音声を 100 の異なる言語で書き起こすことができ、非常に便利です。 MacWhisper にない唯一の機能は、Terminal アプリで Whisper をいじって楽しんだ機能ですが、言語翻訳です。 私はバイラル動画をロシア語と中国語に翻訳しましたが、その言語を話す人たちから Twitter でその翻訳は 正確な.

OpenAI の Whisper からも利用できないが、MacWhisper にないもう XNUMX つの機能は、話者を区別する機能です。 たとえば、XNUMX 人のスピーカーとのインタビューを文字起こししている場合、一方のスピーカーが停止し、別のスピーカーが開始したことを示す明確なマークはありません。 しかし、最終的には誰かがその能力を構築すると思います。 Trint のような有料サービスはこれを自動的に行います。最終的には無料で利用できるようになるのは素晴らしいことですが、支払った分は得られます。

MacWhisper には、コンピューターのマイクからの音声をテキストに変換できる機能もあります。これは、その場で何かを書き起こしたい場合に便利です。

何人かの人が試してみましたが、あまりユーザーフレンドリーなものを作成しなかったため、誰かが最終的にウィスパーの GUI を開発するのはいつになるのだろうかと何ヶ月も考えていました。 しかし、Jordi Bruin によって開発された MacWhisper は、私が待ち望んでいたソフトウェアです。 Bruin は次のようなソフトウェアも開発しました。 マクGPT、これにより、ユーザーはメニューバーから ChatGPT にアクセスできます。

MacWhisperをダウンロードできます 無料でBruin の Web サイトで、電子メールで登録します。

ソース: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/