CAPTCHAって言われると何?って人が多いだろうけど、WEBサービスの登録するときに、読みにくい文字が表示されるアレと言えば、分かる分かるって言う人が多いはず。あのCAPTCHの文字がひどすぎるという話。
確かに読みにくい文字が出てきて、間違えたりすることもあるし、表示された文字を変更したこともあるけど、さすがに紹介されているようなひどいのが出たことはないなぁ。
でも、CAPTCHAの仕組みを知っていれば、こういう文字が登場するのも納得するはず。
実はCAPTCHAって、古文書などの難読文字を人間に解読させようという目的が、裏で動いてる仕組みだったりするんだよね。だから、2つ表示される1つは読みやすい文字列で、2つ目が超難読だったりするわけ。
おそらくだけど、初めて表示された難読文字側は、正解かどうかは無関係に、1つ目の読みやすい文字さえ正解していればOKという処理なんだと思うわけ。で、その時に入力された難読文字が重みとして設定されて、2回目の表示のときの入力と比較され、同じだったら入力が正解の可能性が1ポイント上昇し、違う文字が混ざっていれば違う文字のところのポイントだけ伸びず、その繰り返しで正解の読み方を学習させて、難読文字の正解を決定してるんだと思うんだよね。
ただし、ポイントが上がっていくと、後半の文字列の正解分布の点数の低いものだと、当然不正解という処理をして、ログインさせないとかもしてるだろうけど。
まあ、そんなわけで、古文書の分析に使われたりしてるせいで、文字として読めない文字が登場したり、切り取り方を間違えた文字が出てきてしまったりするんだと思うわけ。
にしても、ひどすぎるよね。