自動書き起こし
Google Docsに向かって喋ったときの記録の一部(改行や注釈を適宜入れた)
- Google ドライブ(*Google Docs)で録音しながらメモを取る
- 一旦録音止めます
- 次はスマホと PC 両方で録音してるアイネいい感じです
- 今度はスマホから録音してみます
- 次はスマホと PC 両方で録音してもいいね
- 邪魔なのでスマホだけにします
- Google ドライブでメモを取るっていうのはだいぶ長いこと行ってないけど
- この音声認識の機能だけ見ると他の手段で代替し得るものがない気がする
- Google Keep は少なくともクライアントアプリ(*非公式)に音声機能が付いていないようだし
- まあ Evernote あるかもしれないけど
- Google の音声認識機能を超えるものは多分ない(*調べてない)
- というのは昨日(*場所名)に行った時に友達から教えてもらった方法で
- ま友達はスマホで音声認識を使いながらメールを書いていてまあちょっと便利か
- まず普段からよく喋っていて滑舌が良くて辻本ってる人じゃないとすじも通っている人じゃないとまともに認識させて文章を書くことができないと思いますが
- まあ彼はそれでもだいぶ使いこなしているようでした
- タイピングが結構疲れるからね
- まあ喋るよりタイピングが疲れるかどうかは人によるとは思うけど
- 昨日の友達の話でも(*場所名)の友達の話でも iPhone ではこれだけの精度が出ないということで基本は Google ドライブで書くこと Google Keep を見ながら喋ろうかなと思ったんだけど
- Google ドライブからフォーカスが落ちるとマイクがオフになってしまうので11マイクをオンにしないといけない
書き起こしについて
- 自分でしゃべったものがすぐに空(*?)になっていくのを見ながら喋る
- 殺人喋ったことが活字になっていくのを見ながら喋るのは不思議な気分ですね
- 今見てから(*見てたら)活字って言ったのに殺人になって途中最初は達人だったのにその後殺人になってしまったそういうのを見るのは面白い
- グーグルドライブと喋ってるみたいGoogle ドライブの音声認識エンジンと会話しているようですね
- 音声認識が早い
- 一人の部屋で誰かと喋ってるように見えるけど
- まあそれで Google ドライブを今家で一人で起動して文章を書いていると言うか書かせている
- この Google ドライブが一旦変換するんだけどなんかおかしいなと思ったらすぐに修正するっていうのが面白い
- とりあえず結果を出すんだけど後で考え直して修正するって人間ポスター人間ぽさ
- 彼が言ってたのは点とか丸を売ってくれないそれはその通り
- 後改行してほしい今20行ぐらい喋っていることになっているけど改行する方法がわからない改行したい
- この Google ドライブのレコーダーがちゃんと聞こえてるのにすいません聞こえませんでしたみたいな表示を出してきておかしい
- 声が聞き取れない掃除ロボットがうるさい
- お酒を飲みながら喋った方がいろいろしゃべって面白そう
- そんなとかが入っている文章は頭が悪く見えるね
- ま対談で指示語の多い文章はよく見るけど実際に見てみると結局何のことを指してるのかわからなかったですごまかしてる感じがする
- 音声認識をベースとした人生生活に移行できるかという実験
- Google が出してきた間違った音声認識結果に引きずられて自分の喋り方も変わるしそもそもあってても Google に合わせて喋っている感じがする
- まあそれはそれでいいことはある側面もある
- 音声認識しやすい食べれば人間にとっても(*聞き取りやすい)
- ただ喋り方がゆっくりになる
- ゆっくり喋るのが悪いというわけではない
- 余計な単語も入りにくくなる
- おーい(*書き起こしが止まった)
- ボソボソ喋らなくなる大きな声でしゃべる
サービスの感想とか愚痴とか
- 音声認識 Google Dogs の音声認識の弱点は句読点と改行が入力できないこれはまあ不便ですねそこは最低限の機能ではないという認識だと思う
- つながりてで保管できるつまり手動で直せる部分タイピングに比べると人力でやるコストが低いとみなされているのかもしれないと
- 大勢で話すときはちゃんとマイクで全員の話していることが聞き取れるかどうかというのは肌になるはず課題になるはず
- 言い直した時は前のセグメントを消してほしい前の文節どっから言い直したのかを自動判定するくらいは出来そうなので
- あと音声認識がオンになってないのについ喋ってしまう
- 114にする(*いちいちオンにする)のがめんどくさいそこも音声で認識してオンにしてほしい Google Home みたいに
- あるいはオフにするのはやめてほしい
ご飯を買ってくる
- このご飯食べながら Google ノートブック(*Google Docs)でメモを取るのはいいかも
- というのはキーボードを叩けないタイミングという意味ではご飯食べてるタイミングが一番人数(*ニーズ)がありそう
- ランチミーティングしながら喋るランチミーティングしながら Google ドライブでメモを取るというユースケースは十分あり得る
- 音楽をかけながら喋るのは悪くない
- PC の前に座ってないといけないというのがあまり本質的ではない
- スマホでスマホで持ち歩いて認識させればいいのかただスマホがすぐにマイクがオフになってしまう
- 今ガムを噛みながら書いてるけど特に遜色ない
- 本当に電話してるみたい何か作業しながらメモ取れるのが良い
- そういえばドイツ行った時に録音しながらドライブしながら録音した経度(*けど)6を切り返す(録音聞き返す)のがめんどくさくてやめた
- やめたわけではない録音はしてたけど録音は残ってるけど読み返してない聞き返してない
- ドライブしながら考えることは割とクリエイティブだったりいつだって日(*逸脱的)だったりするからメモ取りたいんだけどメモを取る手段がまあ当然運転中は6本(*録音)しかないから僕はしてたんだけど
- まあそれも危ないし
- だから Google ドライブにあげると文字起こししてくれたりすると非常にいいね
- コーヒーを入れる時に
- コーヒーが仕上がったのでノーム
- さっきも言ったけどこの Google ドライブの音声認識の微妙なのは画面を切り替えると録音が止まるということで PC 作業しながらの録音には向いてないし
- そうだねミーティングでも PC の前にいる人が喋っても録音する人は PC がいじれないことになるね
- それはめんどくさいそれは設定で変えられないのか ちょっと調べたけどわかんないからクオーラで投稿して返事を回すことにするクオラ
本を読む
- あと音声認識でできそうなのは本を読みながら感想をまとめるようなことは相性がいいかもしれないちょっとやってみるか
- (*ビジネス書を読む)
- 2回目の嫁(*読み)は1回目より面白かったかもしれない
- 喋りながら読んでいるからかもしれないし単に2回目だからかな
- 2回目で喋りながらということはゆっくり読む飛ばし読みができないから考えながら読むと言うことか
- これはまあビジネス書だから有効なのか他の本でもできるのかちょっと分からないけど
- 次は小説を朗読してみるか
- 小説じゃなくてじゃあショーペンハウアーを読んでみるかなんか違うな何が違うのかわからないが
- 声で読みたいものかファウスト舞姫 良さそうだな歎異鈔 ヒューム人性論すごい一発で出た読み方あってるかわからないけど一発で出た
- 公有古寺巡礼普通に読んでると眠くなってしまいそうなやつを声を出しながら読むのがいいかもしれないつまりこうてん(*古典)か青色本読みたいとずっと思ってるのに読めないやつ善の研究まれびとの歴史 こころ吾輩は猫である
- ではダウンロードが済んだものを選んでみようファウストこれは国(*古語)なので日本語が古いので多分ちゃんと認識されないなー
- 勧める言葉昔はが濁れる女に早く浮かびし断るよろめく姿と思うよ再び我が前に近づきたるよゐで来た日は下南たちをとらえんことを心民間ほら無理
- 善の研究 第一種純粋経験第1章経験するというのは事実そのままに知るのイデアルイデアル(*思わず二度読み)全く自己の細工を捨てて事実に従って死ぬのである純粋というのは普通に経験と言っているものもその実は何らかの思想を交えているから後重思慮分別を加えない神に経験そのままの状態を言うのである
- これやろ音声認識されても意味がないな
- 今市音声認識で本を読むこれをこう読めばいいみたいななノウハウがないかも探せば誰かやってるかもしれないけど
- オーディオブックを聞くとかそれは聞く方だからちょっと違うけど
- 朗読して録音するというのはいいけど音声認識させる必要はないよな
- ほとんどの本はだってもう活字になってるし活字になってるほうがただし(*正しい)
- 音声認識させる意味があるのは活字になってなくって今出てきたばかりの生の言葉頭から紡ぎ出されてる言葉本読書の場合は読んで思ったことまあ感想文だ
- 朗読をわざわざ書き起こす必要はない意味がない
独り言の気持ち悪さについて
- この録音して書き起こしたものを自分で読むとすごいやばい感じがする
- しかしそもそも一人で喋ってるやつのやばい感ってな何なんだろうな
- 一人で電車の中で喋っている人の迷惑感日本人から見たときの迷惑感というのは何に根ざしているのか
- 迷惑とは何かという迷惑という言葉を使わずに言うと考えられるのは周りの人無視している感じがするつまり何て言うんだっけ傍若無人館がある
- 本人はしかしじゃあ普通に(*他人と)話してたら傍若無人じゃないのかと言うと別にそんなことはない
- 電話で話してる人と普通に話してる人の違いは何か
- 相手がいないように見えるそれだけ隠者(*じゃ)相手が見えてたらいいのか違う
- 相手が喋っていることがわかればいいのか
- じゃあ電車の中で Skype 会議知ってる人と電車の中で立ち話してる人何が違うわからん
- 電車の中で立ち話してる人は我慢できない仕方ないとみなされる
- なぜ Skype があることができる切っても支障が出ないはず
- 他に昔言われてたのはそういう電磁気電磁波を出すもの混んでる車内で使うなと言う意見ペースメーカーに支障が出るから
- それも本質的ではないはずでほとんどの人には関係ない
- なぜ迷惑だと思うのかそもそもなぜ気持ち悪いと思うのかそれは日本人だからか
- 障害者の人が得語を喋っているのを見て独語つまり独り言を見ておっと思う感じに近いのか
- それがない文化ではつまりみんな独り言でなんか喋ってるような文化ではひとりごとに対して警戒したりしない
- 電話も独り言みたいなもので電話してる人に対してとやかく言うことはしない
- 赤ちゃんに対してもそう
- そもそもみんな喋ってるし
- たぶんそれが海外の電車だとそういうことになるな
- そこで音声認識でなんかしようっていうモチベーションが働くかどうか
- 声って部屋の中で一人で喋って なかなか普通ない体験で例えば何かを朗読するとかだったら理解できるけど
- 普通にタイプすればいいものをわざわざ口で言っているこれに意味があるか
- まあタイプで早いからな喋る方がまずタイプより早い
- 間違いはあるけど早いから喋りなれると本当にまあ速記法の代替になる楽しい
- 気持ち悪さが残るじゃこの気持ち悪さはどこから来てんのか
- 理由として泣くようにの話(*?)か別に一人で喋ってた方がいいんじゃないのそんなに目くじら立てることないんじゃないのっていう話口に出さてる(*?)って言うのは迷惑であるっていうレベルで目次立ててるのか気持ち悪いっていうレベルなのか
- 多分両方あるんだよな
- 日本はその辺が日本と海外でどう違うのかは興味あるな
- 自分の部屋で自分で自分のためにひとりで喋るっていうのは迷惑のレベルはないけど気持ち悪さのレベルはある
- その二つのレベルは別々に解消されていく気がする技術の浸透によって
- つまり電車の中でメモトレ(*とれ)録音でメモとか言っても実行できる人はいないけどほとんど
- 部屋で一人で喋るのはまあ慣れればできるんだって誰にも迷惑かけてないし
- これがタイピングが早い慣れれば思考のアウトプットとしてかなり秀逸な手法であるということがわかったらもう手放せない
- 特に一人で住んでる人がね
- 誰かと共同で住んでる人は難しいそこはシェアハウスの難点だな家族の難点
- なのでこの一人で喋ってる感をなくすための手法として電話に偽装するっていうことが考えられるが
- これとよく似た状況に外国語の勉強があってはまあ喋る一人でどんどんどんどんしゃべることがまあ一人であってもどんどんしゃべるということが上達につながる
- 一応それはあるけどそれはプライベートなスペースでないと難しいシェアハウスとかであら
- まあ外国語の場合はできるか
- 日本語だから難しいのであって外国外国語だと何言ってるかわかんないしそもそも周りの人が聞いても英語の場合はちょっと分かるけど中国語とか例えばなんだスペイン語とかの練習だと何聞いてるかわかんないからいいやということで上達を図る館
- パブリックスペースで一言ひとりごとぶつぶつ外国語で言ってるとやっぱりなんなんだこの人はっていう風になって
- それは気持ち悪いっていうレイヤーもあるけど迷惑っていうレイヤーが少し腐って(*関わって?)いるようだ
- そこでマスクをしてます君中でブツブツ勉強練習するっていう方法が一つあるんだけどまあどうでもいいか
- マスク 持ち悪い女結構日本人のマスク姿の日本人 マスク姿の日本人って気持ち悪い
愚痴
- 今 Google ドライブに向かってとっとっと喋ってるんだけどとつとつと喋っているのだが
- MacBook の電源が勝手に MacBook と行かなんだスリープロック状態になってしまうスリープロックなってしまっているということがある
- これもめんどくさいなこうなるとマイクがオフになってまた気づいてないと喋ってた文が無駄になる
書くことについて
- まあ元々大したこと喋ってないんだけど すごいな今日はなんかずっと喋っている一人なのに
- 面白いこれはおかしいと言うか面白いと言うか別にイノベーティブではないがライフ Changing ではあるが書き起こしてもらうのはいいんだけどブログに書くのはためらわれるか
- どうせまた文章にしないといけないこれを投稿しても面白いんだけどなんかすごいダラダラした感じになる
- それだったら最初から YouTube でよくないか YouTube か podcast だな
- こんなダラダラしたことキャスト(*podcast)やっぱり読むのが早い読む方が早いと思うんだよね
- 細いとかが伝わらないから
- Podcast とかはあと何か作業しながらだとやっぱりポッドキャストオーディオブックの方が良いとなるニコ生でもいいけど
- やっぱり認識ミスが音声認識ミスがあるまあそれも投稿しても面白い
- 面白いけど本当に気持ち悪いブログになるこのまま投稿すると句読点もないし改行がないその気持ち悪さってなどっから来るのか
- これは独り言の気持ち悪さと書き言葉と話し言葉を混同している気持ち悪さが勝っている混ざって
- 今はしゃべることについて喋っていた
- 喋るということが生活に中に侵入してくるか
- 今まで別に喋る必要はなかった人の私生活に道侵入してくるのかということについて喋っていた
- 喋る必要がある人というのはあるまあ飲み会ではさすがに僕も喋るけど挨拶する人プレゼンする人語学の勉強する人そういう人たちではない人たちがしゃべる技術を覚える
- まーこれはしゃべる技術とは少し違うが喋るという表現思考表現方法を活用することで何か変わるのかインプットアウトプットの質が良くなるのかという実験でもある
改行について
- ブログの場合5行ぐらいで改行するようにしていてこの書き起こしもそれぐらいで改行が自動で入るようにしてもいい
- つまりこれは Google ロックスのスクリプトを書けば実現できるような気はするな
- 5行というのは恣意的であまり人によっては短すぎるとか長すぎるって言うのはあるかもしれないけど僕は20行ぐらいの行文章を見ると読む気が失せる
- 5行以上あるとどの行読んでいるのかわからなくなるからかな
- 東京都に(*5行ごとに)今エンターキー押して改行してるんだけど5秒ごとに5行
- この作業は自動化できる気がするまあ自動化したいかどうかは置いといてあと一回改行じゃなくて2回改行してもいい
- この改行については音声認識が入ってこなくなりかつ文章が最後の改行から5行以上になったところで改行するというのがいいかもしれない
- トピックが変わったかどうかを自動で判別するのは難しい
- あるいは改行というキーワード自動で認識して改行入れるようなスクリプトを書くこれが一番簡単かもしれない
- 改行という言葉自体はほとんど必要ないだろうから後でまとめて置換して消しても良い
だんだんゾーンに入ってくる
- クリエイティビティの方法論にフリーライティングってのがあるけどこのフリースピーチっていうのはそれはそれな面白そう
- それとは精神科医とかで使ってるんじゃないかな使ってそうだよなぁ(*適当)
- 連装砲これ連装砲の治療に使えるんじゃないか使えそうだ
- 漢字起こさなくていいもんね(*?)
- だいたいまあ録音しとすれば録音して最初から見るっていうことも治療は必要かもしれないけど本にするときは魔法にするときは結局書き起こすのか
- まあでもいやどうかな音声認識書き起こしソリッド城ホール(*情報量)が落ちるのかな連想たぶん治療における理由連想の場合は全ての経路が重要なのではない気がする
- 最終的にどこのどこにかたどり着いて行くのか
- でもまあその治療法を習得する人から見るとどうやって患者の精神的なトラウマにたどり着くのかという方法を学ぶ過程を学ぶことは重要かもしれない
- その後時にテキスト情報だけでいいのか使えなさそう
- ただこのフリーランスを自由連想をしている時の精神状態は共通していると思ったら共通していると思うちょっと面白いこれは
- 実際今日は一日中音声認識名前で喋っている子喋ってると何か出てくるという気体がある
- なんでそういう期待が持てるかというとそれは人と喋ってると割と新しいことを思いついているという経験がなんとなくある
- ただそれは11メモはしてないんだけどそのメモがリアルタイムで可視化されるということと
- そもそもそういうシチュエーションは相手がいなくても成立するそういうクリエイティビティは発揮されるのかというところが問題として面白い問題設定として面白い
- だから続けているのかもしれない
- はず今考えている内容は特にかつかつ今考えている内容は特に何か読んだり専門的な文献を読んだりネットでググったりしなくても自分の経験をもとに考えながら喋ることができる
- まあブログのエステ(*エッセイ)みたいな感じでしゃべれる
- しゃべって考えを広げたり整理したりすることができる殻割りとレジーナ施工方法レイジーな施工(*思考)方法