Dziś udostępnione zostały dodatkowe materiały tekstowe opracowane w ramach projektu IMPACT, a pochodzące z polskich bibliotek cyfrowych. Nowe zasoby zawierają 478 plików z pełnotekstową transkrypcją, która zawiera informacje o współrzędnych regionów, linii, słów oraz znaków. Taki zasób jest szczególnie przydatny w pracach badawczych, dotyczących m.in. algorytmów automatycznego rozpoznawania znaków. Jakość opracowanych zasobów oscyluje w granicach 99.95%. Wszystkie zasoby dostępne są pod adresem: http://dl.psnc.pl/activities/projekty/impact/results/.
Opracowane zasoby były podstawą prac badawczo-rozwojowych realizowanych przez Poznańskie Centrum Superkomputerowo-Sieciowe w ramach projektu IMPACT. Prace te miały na celu porównanie wyników działania dwóch uznanych na świecie silników OCR: FineReader 10 CE oraz Tesseract 3.0.