"Ogrody Nauk i Sztuk" 2015 (5)

 

Zastosowanie gier skierowanych na cel do anotacji korpusów językowych

 

Dagmara Dziedzic, dag.dziedzic@gmial.com

Uniwersytet im. Adama Mickiewicza w Poznaniu

Ul. Wieniawskiego 1, 61-712 Poznań

 

Wojciech Włodarczyk, wlodarczyk.woj@gmial.com

Uniwersytet im. Adama Mickiewicza w Poznaniu

Ul. Wieniawskiego 1, 61-712 Poznań

 

STRESZCZENIE

Istnienie problemów AI-zupełnych przyczyniło się do poszukiwań alternatywnych sposobów rozwiązywania problemów sztucznej inteligencji, nie opartych wyłącznie na pracy komputera. Pomimo że komunikacja jest dla ludzi czymś oczywistym, nadal nie istnieje sposób jej automatyzacji. Aktualnie powszechnie stosowanym podejściem w rozwiązywaniu problemów NLP jest podejście statystyczne, którego powodzenie zależy od wielkości korpusu językowego. Przygotowanie rzetelnego zbioru danych jest zatem kluczowym aspektem tworzenia statystycznego systemu sztucznej inteligencji. Z uwagi na zaangażowanie specjalistów jest to proces czasochłonny i kosztowny. Jednym z obiecujących podejść, pomagających zredukować czas i koszt tworzenia otagowanego korpusu, jest korzystanie z gier skierowanych na cel. Ambicją niniejszej pracy jest przybliżenie poszczególnych etapów tworzenia gry przeznaczonej do pozyskania zasobów językowych oraz omówienie skuteczności jej działania. Analiza ta zostanie przeprowadzona na podstawie kolekcji gier Wordrobe wspierających anotacje korpusu języka naturalnego.

Słowa kluczowe: gry skierowane na cel, GWAP, crowdsourcing, human computation, przetwarzanie języka naturalnego, sztuczna inteligencja, AI-zupełne, anotacja korpusu, Wordrobe

 

 

The applications of games with a purpose

used for obtaining annotated language resources

 

ABSTRACT

 

The existence of AI-complete problems has led to a growth in research of alternative ways of solving artificial intelligence problems, which are not based solely on the  computer. Although for us communication is obvious, there is still no way automate it. The current widely-used approach to solving the problems of NLP is a statistical one, whose success depends on the size of the training corpus. The preparation of a reliable set of data is therefore a key aspect in creating an artificial intelligence statistical system. Due to the involvement of a large number of specialists this is a very time-consuming and expensive process. One promising approache in helping reduce the time and cost of creating a tagged corpus is the use of games with a purpose. The objective of this paper is to present the stages of creating games with a purpose used for obtaining annotated language resources and to discuss its effectiveness. This analysis will be done based on the Wordrobe project, a collection of games created to support the gathering of an annotated corpus of natural language.

 

Key Words: game with a purpose, GWAP, crowdsourcing, human computation, natural language processing, artificial intelligence, AI-complete, corpus annotation, Wordrobe

 

DOI: 10.15503/onis2015.212.220 pdf pełna wersja