ВЫВОДЫ: По результатам исследования робот оказался практически не хуже людей.
Проверяющие оценили ответы, подготовленные человеком, в среднем, в 2,51 балла, а ИИ - в 2,48. Таким образом, разница составляет 1,2%;
- По сравнению с человеком ИИ Spix дает на 8% меньше плохих ответов (которым была присвоена оценка 1);
- По сравнению с человеком ИИ Spix дает на 64% больше нормальных ответов (которым была присвоена оценка 2);
- По сравнению с человеком ИИ Spix дает на 11% меньше идеальных ответов (которым была присвоена оценка 3)
Ссылка на полное исследование