スマホ文字起こしを「使えるレベル」にする最短ルート|録り方のコツとおすすめ機材を趣味目線で語る

スマホの文字起こしって、最初に試したときは「おお、未来だ!」ってなるのに、実際に仕事の会議やオンライン通話、講義メモで使うと誤変換だらけで心が折れがちなんですよね。僕も最初は「スマホのマイクで普通に録れば十分でしょ」って甘く見て、あとでテキストを眺めて絶望したタイプです。で、いろいろ試して分かったのは、文字起こしの“賢さ”も大事だけど、それ以上に「音がきれいに録れてるか」が勝負、という超地味な真理。結局、文字起こしがうまくいかないときって、スマホがバカなんじゃなくて、僕の録り方が雑なんです。

まず前提として、スマホ文字起こしは「録音が命」です。声が遠い、雑音が多い、机の振動が入る、誰かが同時に喋る。こういう条件が揃うと、どんなに良いサービスでも文字は崩れます。逆に、音が近くて明瞭なら、無料でもそこそこ戦えます。僕がいちばん効果を感じたのは、①マイクを近づける、②机の振動を避ける、③風や空調のノイズを減らす、の3つ。スマホを机にベタ置きすると、ペンを置く音とか、ちょっと手が当たっただけの「ゴン」が盛大に入って悲惨になります。だから、まずはスマホを浮かせるだけでも全然違う。安いのでいいからスマホスタンド(卓上) https://www.amazon.co.jp/s?k=%E3%82%B9%E3%83%9E%E3%83%9B+%E3%82%B9%E3%82%BF%E3%83%B3%E3%83%89+%E5%8D%93%E4%B8%8A&tag=opason-22 を1個置いておくと、地味に勝率が上がります。会議で位置を調整したいならスマホ三脚(卓上・伸縮) https://www.amazon.co.jp/s?k=%E3%82%B9%E3%83%9E%E3%83%9B+%E4%B8%89%E8%84%9A+%E5%8D%93%E4%B8%8A&tag=opason-22 も便利で、僕は「なんか録音がうまくいかない日」に限って三脚を忘れていて泣きます。

で、ここからが“機材沼”なんですが、文字起こしを安定させたいならマイクは正義です。いきなり高いのを買う前に、まずは有線ピンマイクを試すのが手堅い。僕が最初に買って「うわ、世界変わった」と思ったのが BOYA BY-M1 (有線ピンマイク) https://www.amazon.co.jp/s?k=BOYA+BY-M1&tag=opason-22 。胸元に付けるだけで声が近くなるので、文字起こしの誤変換が露骨に減りました。もしスマホがUSB-Cなら BOYA BY-M100UC (USB-C直挿しマイク) https://www.amazon.co.jp/s?k=BOYA+BY-M100UC&tag=opason-22 、iPhone寄りなら BOYA BY-M100D (Lightning直挿しマイク) https://www.amazon.co.jp/s?k=BOYA+BY-M100D&tag=opason-22 みたいに「挿すだけ系」も楽です。あと、製品名をあえてざっくりで探すなら USB-C 有線ラベリアマイク(例:FIFINE等) https://www.amazon.co.jp/s?k=USB-C+%E3%83%A9%E3%83%99%E3%83%AA%E3%82%A2%E3%83%9E%E3%82%A4%E3%82%AF&tag=opason-22 みたいな検索から入るのもアリ。僕は「沼りたくない時期」はこのルートで済ませます。

外出先の風ノイズ、これも文字起こしの敵です。風が吹くと、スマホは言葉じゃなくて“ボワボワ音”を頑張って解析しはじめるので地獄になります。だから風防(ウィンドスクリーン) https://www.amazon.co.jp/s?k=%E3%83%9E%E3%82%A4%E3%82%AF+%E9%A2%A8%E9%98%B2+%E3%82%A6%E3%82%A3%E3%83%B3%E3%83%89%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3&tag=opason-22 は、地味だけど“文字起こしの精度に直結する消耗品”だと思っています。マイク買うならセットで一緒に買ったほうが幸せ。あと、こういう小物って失くしがちなので収納ポーチ(マイク/ケーブル用) https://www.amazon.co.jp/s?k=%E3%83%9E%E3%82%A4%E3%82%AF+%E5%8F%8E%E7%B4%8D+%E3%83%9D%E3%83%BC%E3%83%81&tag=opason-22 を1つ用意しておくと、僕みたいな雑な人間でも運用できます。

「会議や対談の録音」をガチりはじめると、次に欲しくなるのがワイヤレスマイクです。スマホを机の真ん中に置くより、話者の胸元にマイクを付けるほうが音は圧倒的に良い。僕が“うわ、プロっぽい”とテンションが上がったのは DJI Mic 2 https://www.amazon.co.jp/s?k=DJI+Mic+2&tag=opason-22 。ケースに入ってて持ち運びもしやすいし、雑に使ってもそれっぽい音になるのがズルい。ちょっと前から定番枠としてよく聞くのが Rode Wireless GO II https://www.amazon.co.jp/s?k=Rode+Wireless+GO+II&tag=opason-22 と Rode Wireless ME https://www.amazon.co.jp/s?k=Rode+Wireless+ME&tag=opason-22 。「とにかく軽くしたい」「スマホ運用の頻度が高い」なら Hollyland Lark M2 https://www.amazon.co.jp/s?k=Hollyland+Lark+M2&tag=opason-22 も名前をよく見ますし、もう少し手軽に触ってみたい人には Saramonic Blink 500 https://www.amazon.co.jp/s?k=Saramonic+Blink+500&tag=opason-22 みたいな選択肢もあります。ここは好みが出るので、僕は正直“見た目が好きかどうか”でも選んでます。趣味ってそういうもの。

ただ、ワイヤレスは便利だけど、たまに「電池切れ」「接続が変」「どっちが送信機だっけ」みたいな人間側トラブルも起きます。なので、僕は保険として有線も常備する派で、たとえば SONY ECM-LV1 (ステレオピンマイク) https://www.amazon.co.jp/s?k=SONY+ECM-LV1&tag=opason-22 みたいな“結局最後に頼れるやつ”があると安心します。

動画視聴やVlogっぽい録音で文字起こしもしたいなら、カメラ用マイクが刺さることもあります。僕は机に置いて喋る系だと Sennheiser MKE 200 Mobile Kit https://www.amazon.co.jp/s?k=Sennheiser+MKE+200+Mobile+Kit&tag=opason-22 が気になって触ったことがあります。もう一段階ちゃんとやるなら Sennheiser MKE 400 https://www.amazon.co.jp/s?k=Sennheiser+MKE+400&tag=opason-22 も候補に上がりがち。Rode派の人なら iPhoneで使える Rode VideoMic Me-L (iPhone) https://www.amazon.co.jp/s?k=Rode+VideoMic+Me-L&tag=opason-22 、USB-C端末なら Rode VideoMic Me-C (USB-C) https://www.amazon.co.jp/s?k=Rode+VideoMic+Me-C&tag=opason-22 を見ておくと楽しいです。最近だと小型を好む人の間で Rode Wireless Micro https://www.amazon.co.jp/s?k=Rode+Wireless+Micro&tag=opason-22 みたいな名前も見かけます。こういうの、文章で読むより実際に使うと“テンションが上がる音”ってあるんですよね。僕は単純なので、テンションが上がると継続できて、結果的に文字起こしが習慣化します。

「スマホ直挿しの高音質」で気持ちいいのは Shure MV88 (iPhone用デジタルマイク) https://www.amazon.co.jp/s?k=Shure+MV88&tag=opason-22 。これで録った音は聞いてて普通に楽しい。さらにキット系で揃えるなら Shure MV88+ Video Kit https://www.amazon.co.jp/s?k=Shure+MV88%2B+Video+Kit&tag=opason-22 みたいに、いろいろセットになってるのもあります。あと、僕は配信者じゃないのに、なぜか Shure MV7 https://www.amazon.co.jp/s?k=Shure+MV7&tag=opason-22 を一時期欲しくなって危なかったです(物欲だけは一人前)。スマホ運用だとインターフェース系も絡むので、もし「スマホに外部マイクをちゃんと繋いで使いたい」なら Rode AI-Micro https://www.amazon.co.jp/s?k=Rode+AI-Micro&tag=opason-22 や iRig Pre 2 https://www.amazon.co.jp/s?k=iRig+Pre+2&tag=opason-22 みたいな道具を知っておくと、沼の入口が見えます。入口が見えるだけで、なぜか安心します(そして入る)。

録音を「スマホだけ」に寄せるより、僕は最近“別撮り”も好きです。スマホで文字起こしする前提でも、音源をICレコーダーやハンディレコーダーで良くすると、あとからの文字起こしがグッと楽になる。たとえば SONY ICD-UX570F (ICレコーダー) https://www.amazon.co.jp/s?k=SONY+ICD-UX570F&tag=opason-22 は、持ち歩けるサイズ感が良くて「とりあえず録る」がしやすい。ハンディレコーダーなら ZOOM H1n (ハンディレコーダー) https://www.amazon.co.jp/s?k=ZOOM+H1n&tag=opason-22 や TASCAM DR-05X https://www.amazon.co.jp/s?k=TASCAM+DR-05X&tag=opason-22 は、定番として話題に上がりがちです。さらにピンマイク運用に寄せるなら TASCAM DR-10L https://www.amazon.co.jp/s?k=TASCAM+DR-10L&tag=opason-22 みたいに「胸元で録り切る」タイプもあるし、32bitフロートとか気にし始めると ZOOM F2-BT https://www.amazon.co.jp/s?k=ZOOM+F2-BT&tag=opason-22 みたいな方向にも目が行きます。僕はこのへんを調べ始めた時点で「あ、今ちょっと危ない」と自覚しました。

オンライン会議の文字起こしで地味に効くのが、スピーカーフォン系です。ノートPCやスマホの内蔵スピーカーをそのまま拾うと、相手の声がこもったり反響したりで文字起こしが荒れます。会議卓の真ん中に置けるスピーカーフォンだと、音の輪郭がはっきりして結果的にテキストも整いやすい。僕が“使いやすいな”と思ったのが Anker PowerConf (A3301) https://www.amazon.co.jp/s?k=Anker+PowerConf+A3301&tag=opason-22 。もう少しアップデート感のある見た目が好きなら Anker PowerConf S500 https://www.amazon.co.jp/s?k=Anker+PowerConf+S500&tag=opason-22 。昔から定番っぽい雰囲気を感じるのは Jabra Speak 510 https://www.amazon.co.jp/s?k=Jabra+Speak+510&tag=opason-22 。僕は「機材を置いた瞬間、会議の空気がちょっと締まる」感じが好きで、たまに家でも無駄に置いてます(誰も褒めない)。

あと、意外と侮れないのが“イヤホンマイク”。家で一人で文字起こしするなら、Apple EarPods (Lightning) https://www.amazon.co.jp/s?k=Apple+EarPods+Lightning&tag=opason-22 を挿して話すだけで、スマホが口元の音を拾いやすくなって精度が上がることがあります。端子まわりの都合で Apple EarPods (3.5mm) https://www.amazon.co.jp/s?k=Apple+EarPods+3.5mm&tag=opason-22 を使うなら Apple Lightning – 3.5mmアダプタ https://www.amazon.co.jp/s?k=Apple+Lightning+3.5mm+%E3%82%A2%E3%83%80%E3%83%97%E3%82%BF&tag=opason-22 が必要になる場合もありますし、USB-C端末なら USB-C – 3.5mm変換アダプタ(DAC内蔵) https://www.amazon.co.jp/s?k=USB-C+3.5mm+%E5%A4%89%E6%8F%9B+%E3%82%A2%E3%83%80%E3%83%97%E3%82%BF+DAC&tag=opason-22 みたいな変換で整える人も多い印象です。こういうの、見た目は地味なんですけど「音が明瞭になる=文字起こしが救われる」なので、僕はけっこう大事だと思ってます。

ここまで機材の話を熱くしておいてアレなんですが、最終的に勝つのは“運用”です。僕が普段やってる雑だけど効くコツは、①録音開始直後に「日付・場所・テーマ」を自分の声で一回言う(あとで検索しやすい)、②固有名詞はゆっくり言い直す(人名と会社名だけ丁寧に)、③相づちを減らす(えー、あのー、は文字起こしが拾いがちでノイズになる)、④複数人の会話ならスマホを「発言が多い人寄り」に置く、⑤長時間は途中で一回区切って録り直す(1本が長いと管理が面倒)、このへんです。これをやるだけで、同じスマホでも出来上がるテキストの雰囲気が変わります。

で、最後に正直な話。文字起こしって“完全一致の正確さ”を最初から求めるとストレスが溜まります。僕は割り切って、「まずは下書きが自動で出れば勝ち」「重要な固有名詞だけ人力で直す」「要点を拾ってまとめるのがゴール」くらいに置いてます。そうすると、スマホ文字起こしは急に頼れる相棒になります。最初の一歩としては、まず BOYA BY-M1 (有線ピンマイク) https://www.amazon.co.jp/s?k=BOYA+BY-M1&tag=opason-22 みたいな安価なところで音を良くして、スマホスタンド(卓上) https://www.amazon.co.jp/s?k=%E3%82%B9%E3%83%9E%E3%83%9B+%E3%82%B9%E3%82%BF%E3%83%B3%E3%83%89+%E5%8D%93%E4%B8%8A&tag=opason-22 で机の振動を避けて、風防(ウィンドスクリーン) https://www.amazon.co.jp/s?k=%E3%83%9E%E3%82%A4%E3%82%AF+%E9%A2%A8%E9%98%B2+%E3%82%A6%E3%82%A3%E3%83%B3%E3%83%89%E3%82%B9%E3%82%AF%E3%83%AA%E3%83%BC%E3%83%B3&tag=opason-22 を持ち歩く。ここまでやったら、たぶん「文字起こし、思ったより使えるじゃん」ってなるはずです。そこから先は、DJI Mic 2 https://www.amazon.co.jp/s?k=DJI+Mic+2&tag=opason-22 に行くもよし、Rode Wireless GO II https://www.amazon.co.jp/s?k=Rode+Wireless+GO+II&tag=opason-22 に行くもよし、SONY ICD-UX570F (ICレコーダー) https://www.amazon.co.jp/s?k=SONY+ICD-UX570F&tag=opason-22 で別撮りに寄せるもよし。僕みたいに趣味で遊びながら“自分の最適解”を見つけるのが、スマホ文字起こしのいちばん楽しいところだと思ってます。

コメント

タイトルとURLをコピーしました