You are viewing a read-only archive of the Blogs.Harvard network. Learn more.

Optical Character Recognition (OCR) – אפטיש אותיות דערקערונג

זײַנען דאָ קאַמפּוטר פּראָגראַמען פֿאָר לײענען טעקסן פֿון פֿאָטאָגראַפֿיעס. מען רופֿ דאָס אָפּטיש אותיות דערקענונג .זײַנען דאָ דרײ פֿרײַ אָבער ביליק ברירות װי קען לײענען ייִדיש אותיות׃

  1. Adobe Acrobat Professional 9 or above http://www.adobe.com/products/acrobatpro.html
  2. Ulrich Greve’s Yiddish OCR http://www.tichnut.de/jewish/yiddishocr.html
  3. HOCR / hebocr http://hocr.berlios.de/

די ערשט גײַ מיט אַלע קאָמוטורן. די צװײטער איז נאָר פֿאַר װינדאָס. און דער דרײַטער איז נאָר פֿאַר לינוקס. נאָר די צװעטער איז ספּיציעל פֿאַר ייִדיש. די אָנדערע פּראָגראַמען זײַנען פֿאַר לשון-קודש.

There are existing computer programs for reading texts from photographs. This is called Optical Character Recognition, or OCR. There are three free or inexpensive options for reading Yiddish characters. (see above).

The first, Acrobat, runs on most any computer. The second, Ulrich Greve’s OCR program, is Windows only. The last is for Linux or *NIX type OS. (In theory it can also run on a Mac, but the task would not be simple.) Only the second program, Ulrich Greve’s, is specifically designed to reading Yiddish, the rest were designed for reading Hebrew, but still might work.

Comments are closed.

Log in