Human Language Technology Days 2012

W dniach 27-28 września 2012 r. w Warszawie odbyła się konferencja Human Language Technology Days. Została ona zorganizowana przez Instytut Podstaw Informatyki PAN oraz Uniwersytet Łódzki w ramach projektu CESAR (Central and South-East European Resources) – jednego z kilku obecnie finansowanych przez UE projektów, które mają na celu utworzenie wspólnych narzędzi i zasobów językowych dla krajów europejskich.

Prezentacje z pierwszego dnia konferencji pokazały, że obecnie różne dziedziny inżynierii języka wciąż wymagają intensywnego rozwoju, choć niektóre zagadnienia zostały już na tyle dobrze rozpoznane i opracowane, że doczekały się się komercyjnych wdrożeń – większość z nas słyszała o takich usługach jak Google Translate, Siri czy IBM Watson. Ten ostatni to superkomputer, który w 2011 roku zmierzył się w teleturnieju Jeopardy! (znanym w Polsce jako Va Banque) z dwoma ludzkimi przeciwnikami, którzy do tej pory osiągnęli najlepsze wyniki w tej grze, i ich pokonał, udzielając największej liczby poprawnych odpowiedzi na pytania zadawane w programie. O zaawansowanym przetwarzaniu języka oraz reprezentacji wiedzy w tym systemie można było usłyszeć na prezentacji Włodka Zadrożnego – jednego z członków zespołu DeepQA, który stworzył Watsona. Jak się dowiedzieliśmy, obecnie trwają prace nad wykorzystaniem tego systemu w medycynie jako wsparcie w diagnozowaniu. Zainteresowanie budziła również prezentacja Enrique Alfonseca, pracującego w oddziale R&D firmy Google zlokalizowanym w Zurichu. Opowiedział m.in. o uruchomionej w tym roku usłudze Knowledge Graph (opartej na semantycznej bazie wiedzy Freebase) oraz o automatycznym generowaniu streszczeń tekstów (które jest użyteczne do generowania krótkiego opisu aktualnych wydarzeń w usłudze Google News ma podstawie zbioru artykułów na dany temat).

Drugiego dnia spotkania aż 13 zespołów z polskich instytucji badawczych zaprezentowało swój obecny stan prac nad rozwiązywaniem problemów powiązanych z przetwarzaniem języka naturalnego. Zagadnienia przedstawione podczas tych prezentacji były bardzo ciekawe i różnorodne: można było usłyszeć zarówno o algorytmach tworzenia i reprezentacji automatów skończonych (wykorzystywanych m.in. do kompresji słowników), o tworzeniu narzędzi wspomagających pracę lingwistów, jak i o systemach rozpoznawania mowy.

Nagranie video z całego spotkania można obejrzeć pod adresem http://www.hltdays.pl/video.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

*