変換精度より学習精度を向上させろ

ATOKが使えば使うほどバカになっていく件の観察が続いている。
辞書の自動登録はかなり条件を絞ったので、ほとんど増えていない。
複合語という項目により、鳳凰杯を鳳凰と杯の複合語として覚えたようだ。
不要な気もするが害にもならないだろうからまぁ良い。
AppleやMicrosoftを「あっぷる」とか「まいくろそふと」で自動登録されてる。
こういうのを登録しなくても出来る事がクラウド辞書の強みじゃないのかな。
たぶん不要な辞書登録かと思われる。
複合語には該当しないので、未登録語という項目で登録された事になる。
ヘルプでの説明は全くの意味不明で「カタカナ変換された候補」が登録されるはず。
他は人名で「人」を「と」と読ませたら単漢字として登録されている。
いやいや、その人名のまるごとを覚えるならいざ知らず、人名の一部を辞書登録って。
一方でカンビアッソは今の設定じゃ自動登録されず、完備と朝来に毎回分かれちゃう。
辞書にゴミをためないように学習させたい言葉だけを学習させるのは不可能だな。
そして確定履歴の方は、ずっと1400個台で1500個には到達しない。
どうやらこのくらいの数になったら間引かれるっぽいが、その判断基準も怪しい。
古い順というわけでもなく、複数ダブって存在する物も残ったままだ。
このまま続けてたら確定履歴もゴミだらけになりそうな予感がする。

辞書については、本当に出てこない単語は自動登録もされないんだよな。
出てこないから、出すために辞書に登録して読み仮名を振るわけだ。
読み仮名からして違う物こそ、辞書に登録したい物であり、そりゃ当然に手動だ。
じゃぁ自動で登録される物はと言うと、変換で何回かキーを叩いた物と言うことになる。
5番目くらいの候補と15番目くらいの候補を組み合わせた固有名詞とかが登録される。
その単語を次回から簡単に利用するために、自動登録は便利だという事になる。
その次回ってのがあるかどうかわからなくても登録されちゃうから困る。
それを許しちゃうと辞書がゴミだらけで必要な単語が見つけられなくなる。
本当に必要な単語は手動で登録し、それ以外はオンメモリか履歴で短期記憶して欲しい。

おそらく、何でもかんでも学習した方が、人間からは賢く感じる。
手間をかけて変換した単語が次回からは手間いらずで変換出来たら大変便利だ。
だから便利を感じさせるには、何でもかんでもを徹底した方が印象が良くなる。
でも長期で使うとゴミも貯まるので、使えば使うほどバカになると感じる。
どれがゴミでどれが必要な情報かを自動で判断する能力は非常に低い。
どのくらいで定期的にゴミを捨てるべきかもわからない。
ゴミを捨てるときに必要な情報だけ分別するのも手間だ。
と、こういうことが現在のATOKだけじゃなく他の日本語変換も共通の課題。

必要な情報なのに自動学習に頼るから、捨てるときにどれが必要かわからなくなる。
だから必要な情報は手動で登録し、それ以外はどんどん捨てる気でいた方が良い。
個人的な固有名詞を単語登録し、一般的な言葉はクラウドの語数に頼る。
それ以外は、今日の作業分は今日中だけ覚えててくれるオンメモリに頼る。
こんなもんで良くないかな。

性格的に定期的なメンテナンスとかで辞書を維持するのは面倒くさすぎる。
一度設定したらもうバカでも我慢して使う方がマシ。
だから無尽蔵にゴミが登録され続けるくらいなら、学習はしなくて良い。
一定以上は大きくならない事が判明した確定履歴はまぁ、面倒ではない。
しかし古い順に消えるわけじゃないので、何が残るかによってはバカになるだけだ。
今のところは、直近の辞書登録してない頻出単語を出してくれて便利ではある。
一回リセットして「よく使う履歴だけ」にしてまた様子を見るつもりだ。

たぶん関連のある記事:

まだコメントはありません。