InftyReader – system OCR do rozpoznawania wzorów matematycznych w dokumentach naukowych.

InftyReader – system OCR do rozpoznawania wzorów matematycznych w dokumentach naukowych.

Opracowano na podstawie:
http://access2science.com/infty/InftyReader.html

Uwaga:
dodam od siebie, że z systemu Inftyreader korzystają niektóre uniwersytety i biblioteki cyfrowe w Czechach.
zobacz link poniżej:
http://inftyreader.org/infty-scientific-papers/InftyReader-Research-Articles.htm

Wprowadzenie
Technologie optycznego rozpoznawania znaków (OCR) są nieocenione dla poprawy dostępu do materiałów drukowanych przez osoby z niepełnosprawnością odczytu druku.
Większość znanych rozwiązań nie działa dobrze w przypadku treści naukowych. Dokumenty naukowe zazwyczaj zawierają symbole matematyczne i inne specjalne symbole, których nie rozpoznaje standardowy OCR. Ponadto żadna standardowa komercyjna aplikacja OCR nie rozpoznaje struktury równań matematycznych zapisanych dwuwymiarowo, na przykład wzorów nad i pod wspólną kreską ułamkową, i nie konwertuje ich na standardowy format oprogramowania.

Aplikacja Infinity Reader OCR może prawidłowo rozpoznać dokumenty naukowe zeskanowane z dokumentów drukowanych, lub zapisanych w formacie PDF.
InftyReader rozpoznaje skomplikowane wyrażenia matematyczne, tabele, wykresy i inne notacje techniczne i konwertuje je na dostępne formaty.
InftyReader może być używany przez osoby z zaburzonym odczytem druku, w połączeniu z dostępną aplikacją edytora naukowego o nazwie ChattyInfty.
ChattyInfty to rodzaj programu lektorskiego, który zapewnia udźwiękowiony dostęp do odczytu i edycji wzorów matematycznych, oraz do edycji dokumentów utworzonych za pomocą systemu InftyReader.
Osoby widzące mogą używać InftyReader razem z bezpłatnym edytorem Infty Editor, do edycji dokumentów wynikowych przygotowanych przez InftyReader, i tworzenia dostępnych prac naukowych.

Funkcje InftyReader
Wykorzystuje on silnik „”OCR”” ExpressReaderPro firmy Toshiba Corporation i aplikację OCR „”WinReader”” firmy MediaDrive Corporation, aby jednocześnie rozpoznawać znaki w zwykłym tekście.
Wykorzystuje silnik OCR opracowany przez Infty do rozpoznawania matematyki i formuł naukowych.
Może rozpoznawać tabele zawierające wyrażenia matematyczne.
Może konwertować czarno-białe zeskanowane dokumenty i pliki PDF
Rozpoznaje poszczególne strony w pliku PDF
Jest licencjonowany do użytku biznesowego / komercyjnego
Oferowane są różne sposoby zakupu produktu, od 50 USD w rocznym abonamencie, do wersji profesjonalnej dla drukarni i bibliotek cyfrowych za 5 000 USD.

Formaty wyjściowe
InftyReader może eksportować wyniki rozpoznawania w dowolnym z poniższych formatów
IML
Lateks
HR-TeX
XHTML + MathML
Microsoft Word 2007 i nowszych (XML)
IML jest formatem plików XML opracowanym w trybie ekspresowym dla InftyEditor i ChattyInfty. Domyślnie InftyReader zapisze wyniki w IML. Oryginalny obraz zostanie zachowany i może zostać wyświetlony za pomocą edytora Infty Editor lub ChattyInfty. W ChattyInfty można uzyskać dostęp do obrazu za pomocą graficznego wyświetlacza on-line (dostępnego w KGS Japan) lub wytłaczając go na drukarce ViewPlus. W związku z tym użytkownicy Infinity Editor i ChattyInfty mogą porównywać wyniki z oryginalnym obrazem iw razie potrzeby wprowadzać poprawki. Edytory te mogą również przekonwertować wynik na dowolny z wymienionych powyżej formatów.

Poza formatem IML, formaty allInfty oprócz HR-TeX są standardowymi formularzami głównego nurtu. HR-TeX (Human-Readable TeX), to skrócona notacja podobna do LaTeX, opracowana tak, aby była łatwiejsza do odczytania niż standardowa LaTeX.

wymagania systemowe
InftyReader i ChattyInfty wymagają systemów operacyjnych Windows XP, Vista lub Windows7, Windows 10, 32 lub 64-bitowych. Microsoft Internet Explorer7 lub nowszy musi być zainstalowany. Aby poprawić błędy OCR i edytować dokumenty, zalecamy zainstalowanie bezpłatnego edytora Infty do użycia przez osoby widzące lub edytor ChattyInfty do użytku przez osoby z zaburzonym odczytem druku.

Procedura instalacji
Początkowe pobrane archiwum InftyReader lub ChattyInfty jest plikiem zip. Wyodrębnij zawartość do dowolnego wygodnego folderu. Jeden plik kończy się na „”setup.exe””. Uruchom ten plik, aby zainstalować InftyReader lub ChattyInfty i wszystkie składniki niezbędne do ich użycia. Pamiętaj, że do instalowania aplikacji wymagane są uprawnienia administratora.

Optymalizacja jakości rozpoznawania OCR
InftyReader rozpoznaje tylko wysokiej jakości obraz czarno-biały (binarny). W przypadku dokumentów papierowych bardzo ważne jest zeskanowanie dokumentu w trybie czarno-białym (binarnym) i użycie rozdzielczości co najmniej 400 dpi. 600 dpi jest zalecane, aby uzyskać najlepsze wyniki. Papier powinien być płaski i starannie ustawiony w skanerze, aby uniknąć rozmycia, lub pochylenia. Jeśli to możliwe, strony w książkach należy ułożyć płasko na skanerze.
Zapisz zeskanowane pliki w formacie TIFF, GIF lub PNG.

Rozpoznawanie znaków matematycznych wymaga obrazów o znacznie wyższej jakości niż w przypadku standardowego OCR, a słabej jakości obrazy będą odpowiednio słabe. Zaawansowani użytkownicy InftyReadera mogą poprawić jakość rozpoznawania poprzez edycję zeskanowanych obrazów w celu usunięcia niewielkich ubocznych defektów skanowania i artefaktów. Rozpoznanie można poprawić, optymalizując próg skanera, aby mniej niż 1% znaków zostało zerwanych lub dotknęło innych znaków.

InftyReader dzieli dokument na tekst, matematykę, tabele i rysunki, a następnie wykorzystuje różne procedury rozpoznawania każdego z nich. Użytkownicy mogą poprawić jakość rozpoznawania poprzez ręczną edycję obrazów, aby zapewnić prawidłowe przesyłanie treści. Na przykład rozcinanie kolumn i układanie ich we właściwej kolejności jest zalecane, gdy strony są częściowo zmumifikowane.

Jednym z typowych problemów, których należy unikać w przypadku zeskanowanych obrazów, jest ciemna ramka, która może się pojawić na stronie. Ten problem jest spowodowany nie białym obszarem nad stroną podczas skanowania. Można tego uniknąć, umieszczając duży biały papier na skanowanej stronie. Papier powinien być wystarczająco duży, aby pokryć całą powierzchnię skanera. Obrazy z takimi problemami można naprawić, usuwając ciemną ramkę w dobrym edytorze obrazów. Należy uważać, aby nie zmniejszyć obrazu dpi podczas takiego procesu.

Można również rozpoznać plik PDF. Normalne pliki PDF mają postacie reprezentowane czcionkami i mają mniej problemów z rozpoznaniem OCR niż zeskanowane obrazy. Zawsze należy uzyskać plik PDF, jeśli to możliwe. Artykuły w większości czasopism naukowych są dostępne w formacie PDF.

Instrukcje krok po kroku dotyczące korzystania z InftyReadera
InftyReader to aplikacja GUI. Można go używać w trybie poleceń w oknie konsoli, uruchamiając program Infty.exe z folderu programu Infty. Ten samouczek jest ograniczony do wersji GUI. Wykorzystanie trybu poleceń jest zawarte w pliku InftyHelpE.txt znajdującym się w archiwum.

Krok 1. Uruchom InftyReader.
Znajdziesz wiele przycisków i pól edycji, jeśli wciśniesz klawisz TAB, na początkowym ekranie InftyReader.
Użyj spacji, aby aktywować przyciski, a nie Enter. Ekran zawiera następujące elementy:
Trzy przyciski umożliwiające wybór pliku do rozpoznania, folderu do rozpoznania lub skanowania w dokumencie.
Pole tylko do odczytu, które pokaże bieżący plik wejściowy / nazwę folderu. Jest początkowo pusty.
Pole wyboru umożliwiające wybór żądanego formatu wejściowego. Dostępne opcje to Tiff, BMP, GIF, PNG i PDF.
Pole tylko do odczytu pokazujące nazwę pliku wyjściowego / folderu. Jest początkowo pusty.
Pole wyboru dające wybór formatu wyjściowego. Dostępne opcje to IML, LaTeX, HR-TeX, XHTML (MathML) i Microsoft Word 2007 (XML).
Tak / nie ma wyboru, czy otworzyć plik wyjściowy w odpowiedniej aplikacji. Domyślna wartość to „”nie””.
Wybór, czy umieścić wskaźnik nowej linii na końcu każdego akapitu. Domyślnie jest ustawione na tak.
Przycisk „”Uruchom OCR””, który należy nacisnąć po dokonaniu wszystkich wyborów.
Przycisk wyjścia, który zamyka InftyReader
Wybór poziomu matematyki jako „”wszystkich symboli matematycznych”” lub „”symboli matematycznych na poziomie liceum””.
Wybierz tę drugą, jeśli matematyka jest prosta, ponieważ rozpoznawanie będzie lepsze.
Wybór korzystania z InftyReader w języku angielskim lub japońskim.
Krok 2 polega na ustawieniu różnych opcji, a następnie wybraniu pliku, folderu lub wejścia skanowania.
Jeśli zdecydujesz się na konwersję pojedynczego pliku, kliknij przycisk „”Plik””, naciskając klawisz spacji lub klikając lewym przyciskiem myszy. Spowoduje to otwarcie standardowego okna „”otwartego”” okna dialogowego, które umożliwia wpisanie nazwy pliku lub wyszukanie go. Istnieje możliwość zapisania tego pliku jako „”tylko do odczytu”” i przycisku „”otwarty””. Po wybraniu pliku naciśnij przycisk „”Otwórz””. Po krótkim opóźnieniu przetwarzania początkowy ekran pojawia się ponownie z wypełnionymi wejściowymi i domyślnymi nazwami plików wyjściowych. Możesz edytować nazwę pliku wyjściowego lub przejść do innego folderu, jeśli chcesz.
Jeśli klikniesz na „”folder””, otworzysz drzewo wyboru, które pozwoli ci wyszukać żądany folder wejściowy. Po znalezieniu folderu naciśnij „”ok””. Ekran początkowy pojawi się ponownie z wypełnioną nazwą folderu wejściowego. Pole Nazwa pliku wyjściowego jest puste. Nie można edytować nazwy folderu wyjściowego. Zostanie wyświetlone dodatkowe okno, w którym można wybrać, czy konwertować pliki w podfolderach. Domyślnie dla tego „”Wybór podfolderów wyszukiwania”” jest wyłączony.
Krok 3: Ustaw żądany poziom dpi w oknie, dając opcję 600 lub 400 dpi. Następnie naciśnij przycisk „”Uruchom OCR”” za pomocą spacji lub myszy.
Jeśli wybrałeś LaTeX dla formatu wyjściowego, po naciśnięciu przycisku „”Start OCR””, otrzymasz długą listę opcji LaTeX. Jeśli znasz LaTeX-a, rozpoznasz te opcje. Jeśli nie, zalecamy wybranie żądanego rozmiaru papieru, a następnie zaakceptowanie wszystkich innych domyślnych opcji i naciśnięcie „”ok””, aby kontynuować.
Jeśli zdecydowałeś się przekonwertować pojedynczy plik:
Plik wyjściowy będzie znajdować się w tym samym folderze co plik wejściowy i domyślnie będzie mieć tę samą nazwę, z wyjątkiem rozszerzenia. Rozszerzenie będzie takie, jakie zostało wybrane dla formatu wyjściowego. Na przykład File0.tiff utworzy plik wyjściowy File0.iml, jeśli iml jest formatem wyjściowym, File0.tex, jeśli LaTeX jest formatem wyjściowym itp.
Przekonasz się, że istnieją również inne pliki tworzone przez InftyReader, w tym samym folderze, co pliki wejściowe i wyjściowe. Co najmniej będzie plik dziennika, czasami kilka plików dziennika. Inne pliki będą tworzone, w zależności od używanego formatu wyjściowego.
Jeśli zdecydowałeś się przekonwertować folder:
InftyReader skonwertuje wszystkie pliki obrazów w tym folderze o określonym formacie wejściowym. Wszystkie dane wyjściowe zostaną umieszczone w jednym pliku o nazwie folderu z rozszerzeniem danych wyjściowych. Na przykład wszystkie pliki w folderze Hi będą znajdować się w jednym pliku Hi.iml dla wyjścia IML, Hi.tex dla wyjścia LaTeX itp.
Jeśli zaznaczone jest pole „”Wyszukaj podfoldery””, InftyReader będzie także konwertował pliki we wszystkich podfolderach. Wszystkie dane wyjściowe w podfolderze HiThere będą w HiThere i zebrane w jeden plik HiThere.iml itp.

 

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *