AKTYWNA ADNOTACJA W OCENIE WIARYGODNOŚCI INTERNETOWYCH INFORMACJI MEDYCZNYCH

Pod koniec listopada opublikowany został artykuł zatytułowany „Active Annotation in Evaluating the Credibility of Web-Based Medical Information: Guidelines for Creating Training Data Sets for Machine Learning”, którego jednym z autorów jest prof. Mikołaj Morzy, kierownik naszej grupy badawczej z Poznania.

Głównym rezultatem przedstawionym w artykule jest zaprojektowanie i wdrożenie aktywnego procesu adnotacji do ręcznego oznaczania wiarygodności informacji medycznych znalezionych w sieci. Aktywny proces adnotacji pozwala wykryć i oznaczyć dwa razy więcej niewiarygodnych twierdzeń jako adnotację losową w tym samym przedziale czasowym. Osiąga się to poprzez grupowanie podobnych semantycznie zdań w grupy i ponowne uszeregowanie zdań pod kątem adnotacji w obrębie klastrów. Zdania, które znajdują się w klastrach zawierających wiele niewiarygodnych zdań, są umieszczane na szczycie rankingu, dzięki czemu adnotatorzy mogą znaleźć znacznie więcej niewiarygodnych i wątpliwych twierdzeń. Ta rekurencyjna procedura polegająca na grupowaniu zdań, a następnie ponownym tworzeniu ich rankingu, jest oryginalnym wkładem projektu #Cyber_odporność. Jest to procedura podobna w duchu do tej stosowanej przez zespół projektu #Cyber_odporność podczas opisywania fałszywych wiadomości w tweetach związanych z COVID-19.