Програмата не може да назове индивидуални автори, но посочва кога даден пасаж е написан от повече от един човек и откъде е поел нов автор.
Това става, като се сравняват набори от синоними заедно с употребата на предлози и други служебни думи. Така се идентифицират два основни стила – църковен и лаически.
Учените от университета Бар-Илан са тествали алгоритъма с две книги от Стария завет – на пророк Йеремия и на пророк Йезекиил.
Те размесили текстовете, а алгоритъмът успял да ги разграничи с 99 процента точност.
Алгоритъмът може също да ускори сравняването на текстове, като използва критерии, които не подлежат на интерпретиране, т.е. може да игнорира самото повествование, или какво е имал предвид авторът.
Той може също да улови по-фини нюанси от хората в употребата на думите, съобщава БТА.
Източник dnes.bg
Няма коментари:
Публикуване на коментар