為什麼OCR的最低標準是300 dpi?

OCR光學文字辨識,是Optical Character Recognition的簡稱,主要目的是將圖像中的文字轉化成電腦能夠識別的電子訊號,是透過影像處理系統的分析和比對來完成的。其實沒有任何官方規定要以300 dpi的解析度來進行掃描,但業界普遍認為這是進行OCR的黃金標準喲!

大部分知名的OCR軟體公司都建議最少需要以300dpi來進行掃描,才能有效地分析判別文字。如同我們之前的文章「掃描時常聽到的dpi究竟是什麼呢?」中所介紹的,以300 dpi的解析度來進行掃描,代表的意義是每平方英寸的文件,掃描器會擷取水平300點、垂直300點,總共90,000點(300 X 300 = 每平方英寸90,000點)來呈現。如果換成是使用200 dpi來掃描的話,則每平方英寸只能看到40,000點。看到了吧,點數差很多吼,這樣應該很容易可以看出其中的差別了吧!

我們可以這樣說,高解析度的掃描結果可以提高OCR的準確性。因為OCR是一種由電腦來判別掃描文字的技術,每平方英寸的點越多,電腦越容易判斷,因為它有更多的數據資料可以進行比對分析,對文字做出的判斷可以更正確。

Leave a Reply

%d bloggers like this: