memo/20230919
created 2023-09-19 modified 2023-09-19
こんばんは。
ニュースキャスターが、ニュース番組冒頭で「おはようございます」とか「こんばんは」とか、挨拶語を話すようになって久しいですね。
昔はなかった習慣ですよね。
その昔、マクドナルドで「いらっしゃいませ今日はー」との挨拶に違和感を感じていた私、なのですが。
このところは、テレビに挨拶を返すようになってきました。もう完全にオッサンというか老人です。
そして何故か、ニュースキャスターの「こんばんは」に対して、「わんわんお」と返したくなるのです。衝動的に。
■
「わんわん」は犬の鳴き声(吠え声)の擬音語ですね。またそれに由来して幼児語として犬そのものを意味したりもしますね。
2ch(今は5ch)などのネットオタクの巣窟にて、語の意味がかろうじて分かる程度にカナを1文字足したり、長音を挟んだり、変な所を音便化して言葉を崩す、という謎の文化があります。
猫→ネッコ
犬→イッヌ
兄→アッニ
姉→アッネ
おっぱい→オパーイ
セックス→セクース
などです。もしかしたら、性的な語など、人間がタブー視する語に対し、直接表現する事をやんわり避けようとする意図も、あったのかも知れません。
■
「わんわんお」というのもおそらくその様な「ネットオタク語」の一種なのでしょう。加えて推測するに、「犬の、飼い主に対する親愛の感情が溢れて興奮しているさま」を表現するために、犬のセリフ表現として「わんわんお!わんわんお!」等と使うのだと思います。
この「わんわんお!」が私の脳に焼き付いており、更に高齢男性特有の「異様にダジャレ好きになる」性質が発露しているためと思われるのですが、
ニュースキャスターが夜のニュース番組冒頭で
「こんばんは」
と挨拶をすると、自分の中の会話エンジンが働いて
「わんわんお」
と返したくなるのです。
「こんばんは」
「わんわんお」
実際の対面のコミュニケーションで行ったらきっと、奇異な目で見られるか、「はぁ?」という困惑の反応が起きる事でしょう。
なのですが、私の脳内では 自然なやり取りとして
「こんばんは」に
「わんわんお」を
返したくなるのです。実際に返しています。
はあ。困ったもんです。
■
昨今のAIというか「機械学習の機械」は、"A"という語の後に"B"という語が続く可能性が高いとか低い、とかの計算をべらぼうな数で行っている、などと言われます。
脳の神経細胞、ニューロンの活性化が連鎖する様を模したのが始まりで、今はもうちょっと工夫しているのだそうです。
この「連続性」の学習が、私の脳内で、壊れてきているのかも、しれません。こんばんは。わんわんお。
■
今どきの、GPUをフル活用するAIなど、私にはもう実装する力がありませんが…
私は駆け出しの頃、
「Webページの内容を読み、カテゴリを疑似統計的に判定する」
アルゴリズムを考案して実装し、納品したことがあります。
というか、私の独立第一号の仕事が、それでした。
「カテゴリ判定するようなプログラムを作れないか」と友人から相談され、うーん、できると思う、と作り始めました。
判定したいカテゴリに何があるかは、人間が決めます。
・スポーツ
・政治
・エロ
・グルメ
など。カテゴリ数は固定です。この場合4つです。実際には友人が選んだ5つのカテゴリだった気がします。
ここから私の考案でした。
そのカテゴリごとに学習対象のWebページを複数選んで、
特徴単語として
・3文字以上の漢字の連続
・4文字以上のカタカナの連続
を抽出し、特徴単語の頻度分布表を作ります。
カテゴリ1個に対し、単語の頻度分布表が1個できます。
次に、任意のWebページのカテゴリを判定します。
判定したい Webページにも同様の単語抽出を行い、
予め学習していた全カテゴリ(4つ)のヒストグラムと、判定対象のWebページのヒストグラムをかけ合わせます。
かけ合わせた値の合計を求めます(積分値みたいなもの…という解釈でした)。
この値が一番高い「カテゴリ」を、該当Webページのカテゴリと判定します。
で
これを、コトバの通りの順に処理するよう組むと遅いので、読んでいるWebページをパイプで判定プロセスに流すと
単語抽出と全カテゴリのスコア計算を随時行い、全部通したらもう答えが出る、ようにしました。
実際には、当初思ったようなデータ(きれいな波型のようなヒストグラム)は得られなくて。
横軸に単語を並べると ゼロ ゼロ ゼロ ... ばかりが続く後に イチ がまれにある、ようなデータでしたが。
へー、と思う程度に判定できていました。
当時、ネット回線速度が遅いこともあって、CPU処理速度に対し通信の待ち時間が長く、
ページを読み終わると即座に判定値が得られるようなプログラムになりました。
■
オッサンの脳がダジャレでイカれているという話と、
過去に作ったプログラムを懐かしむ話。
でした。
【* 日々のメモ】