MarkScan 入門 しきい値 とは何かを知ろう

マークシートを使ったアンケートやテストを実現するアプリケーションである MarkScan ですが、このソフトの説明を少しずつしていきたいと思います。今回は しきい値 についてです。

 

MarkScanでは、読み込みのために重要なパラメーターが2つあります。それが、しきい値と濃度です。まずはしきい値について説明します。

コンピューターの画像は、ピクセル(画素)と言われるものが集まって構成されています。

このピクセルですが、読み込んだマークシートの画像は グレースケール という0〜255 までの数値の画像形式で表現されています。これは色情報は一切なく、明度のみの値です。昔の白黒テレビみたいな感じですね。

ちなみに、0が真っ黒、255が真っ白を意味します。

画像処理をするためには、この0〜255の数字を0と1に置き換える(2値化といいます)必要があるのですが、どの数字を境界線にして0にするのか、1にするのか、を決める必要があります。これがしきい値というものです。

たとえば、このグレースケールの画像を2値化することを考えてみましょう。

 

これは、しきい値を100にした場合です。0〜99の場所は黒になり、100〜255までの場所は白になります。コレはちょっと全体的に白くなりすぎですね。

 

少し上げて128にしてみました。256の丁度半分の値になります。コレでもいいのですが、塗ったつもりの領域が白飛びしているところがあります。もう少し調整したいところです。

 

240までしきい値を上げてみました。240が私のオススメの数値です。

 

しきい値は大きければよいというものではありません。たとえば、次の例は250まで上げてみた例です。枠線の周りに黒いノイズが発生してしまっています。こうなると、このノイズが読み取りエラーを起こす原因になったりします。

 

このように、しきい値はギリギリの値を見つけ出すのが重要になってきます。

影響するのは、スキャナと筆記用具でしょう。MarkScanは、最適な値を見つければ十分活用できるソフトウェアです。次回は、重要な要素の一つである、濃度について説明してみたいと思います。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です