3秒で盗まれる声と、茶の間の合言葉

参考記事：「もしもし？」その3秒で破滅…AI時代の最新オレオレ詐欺が恐ろしすぎる

札幌の夜は、相変わらず容赦がありません。窓の外は何日も降り積もった雪が街の音をすべて飲み込んで、耳が痛くなるほどの静寂に包まれています。ストーブの灯油メーターが赤く点滅しているのに気づきながら、つい腰を上げるのが億劫で。焼酎のお湯割りをすすりながら、さっきまで見ていた番組の余韻……というか、得体の知れない「寒気」を振り払おうとしています。

webライターの健一です。今日は、新作アニメのレビュー……のつもりで書き始めたのですが、2月21日放送のNHK『クローズアップ現代』が描き出した「AI音声詐欺」の実態が、あまりにも巧妙で、まるで質の悪いサイバーパンク・サスペンスを観ているような気分になったので、その切り口で語らせてください。

■ 今回の「物語」のハイライトまとめ

AI音声クローン：わずか3秒の録音から、声帯の震えや感情の揺れまで再現する。
間違い電話の罠：何気ない「はい？」という返答が、そのままサンプリング素材として盗まれる。
最強のセキュリティ：ネットには1文字も出ていない、家族だけの「泥臭い記憶」。

オートガススタンドの「確かな声」と、AIの「設計図」
AI音声クローン技術の現在地（詳細データ）
60代親父から見た「悪役」の心理と、家族の行動
デジタルを越える「泥臭い記憶」という最強の盾
AI音声詐欺から家族を守る3つの対策

オートガススタンドの「確かな声」と、AIの「設計図」

昭和の終わりから30年以上、俺はオートガススタンドの現場で働いてきました。タクシーの運転手さんと「今日はしばれるね」なんて言葉を交わしながら、LPGを充填する。

あの場所には、鉄の匂いと、温度のある「確かな人の声」がありました。でも、今のAIってやつは、その声を「設計図」みたいにバラして、コピーしちまうんだそうです。

勉強してみて驚いたんですが、最新の技術は3秒あれば十分。声帯の震えから喋りの癖、果ては感情の揺れまで抜き出す。サンプル音声を聴いた時、正直、胸の奥がざわつきました。よく聴けば、語尾の息継ぎに少しだけ「金属っぽい響き」があるような気がします。

非人間的なリズム、とでも言うんでしょうか。でも、もしこれが深夜の電話で、パニックになっている時に聞こえてきたら？認知症を患っている俺の母や、心の病を抱える妹が、その「わずかな違和感」に気づけるとは、到底思えない。それが、現実の恐怖なんです。

AI音声クローン技術の現在地（詳細データ）

数秒の音声でクローン可能（McAfee「Artificial Imposter」調査 2024引用）

（PR TIMES プレスリリース）： https://prtimes.jp/main/html/rd/p/000000032.000033447.html

セキュリティ大手のマカフィーが2023年から2024年にかけて発表した報告書によると、わずか3秒のサンプルがあれば、最大95%の精度で本人の声を再現できると警鐘を鳴らしています。最新のオープンソースモデル（2024年発表の「F5-TTS」など）では、たった数秒の「はい、もしもし」という音声から、感情の起伏までコピーすることが可能です。

音声詐欺被害は前年比 87.9％増（警察庁：令和6年/2024年確定値）

リンク： 警察庁：令和６年における特殊詐欺の状況について（PDF）

警察庁の最新統計によると、2024年（令和6年）の「オレオレ詐欺（声によるなりすましが主）」の被害額は、前年から約87.9％と大幅に増加し、約153.1億円に達しました。特殊詐欺全体の被害額も過去最悪のペースで増加しており、特にAI技術を悪用した巧妙な「声のなりすまし」がその押し上げ要因の一つと分析されています。

高齢者被害が全体の 65.4％（IPA/警察庁データ）

リンク： 警察庁：令和６年における特殊詐欺及びＳＮＳ型投資・ロマンス詐欺の認知・検挙状況等について（確定値版）

警察庁が発表し、IPA（情報処理推進機構）も注意喚起を行っているデータによると、特殊詐欺被害者のうち、65歳以上の高齢者が占める割合は65.4％にのぼります。特に固定電話への着信をきっかけとした被害が多く、健一さんが懸念されている通り、家族を想う心の隙を突く手口が後を絶ちません。

60代親父から見た「悪役」の心理と、家族の行動

ここで少し、俺なりの視点で今回の「登場人物」たちの心理を深掘りさせてください。犯人たちは、いきなり牙を剥かない。これが一番狡猾なところです。まずは間違い電話を装って、こちらの声を「採取」しに来る。

「あ、〇〇さんの家じゃありませんか？」という問いかけに、こちらが「違いますよ」と答える。その瞬間に、俺の「声」というアイデンティティは奪われているんです。あいつらは、盗んだ声に「事故」だの「誘拐」だのという、悲しいシナリオを合成する。

アメリカでは娘の声を偽造した誘拐詐欺、香港ではディープフェイクで38億円もの被害が出たというデータ（※BBCニュース参照）もあります。俺がこの「犯人役」たちの行動を見ていて何より腹が立つのは、

「家族を想う気持ち」を、最も効率的な攻撃リソースとして利用している点

です。技術が進化して、便利になるのはいい。でも、その進化が「人を想う心」を逆手に取って、絶望に叩き落とすために使われる。そんなのは、あまりにも残酷じゃないですか。深夜アニメの冷酷なアンドロイドの方が、まだ人情があるってもんです。

デジタルを越える「泥臭い記憶」という最強の盾

AIボイスクローン詐欺の手口と対策をまとめたインフォグラフィック。わずか3秒の音声でクローンが完成する恐怖と、家族を守る対策が解説されている — ネットにない「泥臭い記憶」が最強の合言葉。最新技術の悪用から家族を守るための処方箋。AI生成画像です。

番号表示で知らない番号を弾いても、家族の番号を装う「スプーフィング」という手口を使われれば無効。自動録音で威嚇しても、相手は機械だ。恐怖を感じず、淡々と俺の声を盗み続ける。

結局、最後に俺たちを守るのは、クラウドの高度なセキュリティなんかじゃない。 「茶の間での会話」なんだと、妙に腑に落ちました。 AIはインターネットの海から何でも学習しますが、俺の家の居間で交わされた「なんでもない会話」までは知り得ません。合言葉を決めるなら、誕生日やペットの名前じゃダメ。そんなのはSNSを辿ればAIが数秒で見つけ出しちまう。

もっと泥臭い、俺たちにしか分からないエピソードがいいんです。例えば、「20年前に家族で行った小樽で、お父さんがソフトクリームを落として半べそかいた場所は？」とかね。笑っちまうような、でも思い出すと少し温かくなるような、そんな「固有の記憶」。犯人が「はい」か「いいえ」では逃げられない問いを、家族で共有しておく。これこそが、最強の防犯デバイスだと俺は確信しています。

夜が更けて、また雪が強まってきたようです。自分の声さえ信じられなくなる時代。困ったものですが、だからこそ、私たちが一緒に過ごしてきた「時間の厚み」が、これまでになく価値を増している気がします。 AIがノイズとして排除したがる「無駄な思い出」や「言い間違え」、「一緒に笑った記憶」。

それこそが、人間が人間である証拠であり、最強の盾になる。この記事を読み終えたら、どうか大切な人に電話をしてみてください。「万が一のために、俺たちだけの合言葉を決めないか？」その不器用な一言が、どんな最新のセキュリティソフトよりも、家族を強く守ってくれるはずです。

さて、いい加減に灯油を補充してこないと。明日の朝は、また雪かきから始まりそうです。

AI音声詐欺から家族を守る3つの対策

家族だけの合言葉を決める
不審な電話は一度切り返す
公開音声をむやみに出さない

■ 参考資料（根拠となるデータ）

特殊詐欺対策：番号偽装への注意（IPA）

■ 参考サイト

還暦の現場技術者・健一：プロフィール

札幌在住。32年間、石油業界の最前線でプラントのメンテナンスに命を削ってきた元エンジニア。

厳寒の地でボルト一つ、バルブ一つの「軋み」を聞き分けてきた経験は、今、アニメの中に生きるキャラクターたちの「心の軋み」を読み解く力へと変わった。現在は統合失調症の妹と高齢の母をケアする生活者として、日々「ままならぬ現実」と対峙している。

効率やスピードばかりを尊ぶ現代において、あえて時間をかける「手入れ」の尊さを説く。私の書く言葉は、雪の夜のストーブのように、不器用だが確かな熱を宿すと信じている。

アニメレビューは⇒健一のアニメレビュー　お品書き

健一の特撮ブログ

AI音声詐欺 #音声クローン #特殊詐欺対策 #家族を守る #合言葉 #高齢者防犯 #ディープフェイク #サイバー犯罪 #クローズアップ現代 #防犯意識

AI音声詐欺｜3秒で声が盗まれる時代の家族対策3選