Zdjęcie poglądowe
BrianPenny
Uwaga, wysokie temperatury!
Sprawdź lokalną prognozę pogody

Sztuczna inteligencja w komunikacji z psami

Deweloperzy sztucznej inteligencji (SI) wkraczają w świat komunikacji zwierząt. Wykorzystując oprogramowanie do uczenia maszynowego, badacze zdołali z powodzeniem rozszyfrować znaczenie wokalizacji psó

Autorzy badania, które jeszcze czeka na recenzję, nagrali szczekanie, warczenie, wycie i skomlenie 74 psów domowych w różnych sytuacjach zaprojektowanych tak, aby wywołać określone reakcje. Te scenariusze obejmowały zabawy z ulubionymi zabawkami psów oraz symulację ataków na właścicieli przez badaczy.

Na podstawie nagrań autorzy zidentyfikowali 14 różnych typów wokalizacji psów, takich jak „pozytywne dźwięki” podczas zabawy, „szczekanie ze smutkiem/lękiem” oraz „bardzo agresywne szczekanie w kierunku nieznajomego”. Model SI o nazwie Wav2Vec2, pierwotnie zaprojektowany do rozpoznawania ludzkiego głosu, został następnie wytrenowany na tych dźwiękach psów i poddany serii testów

Pierwszy test polegał na rozpoznaniu poszczególnych psów na podstawie ich wokalizacji. Co zaskakujące, kiedy SI była wstępnie wytrenowana na ludzkim głosie, udało się jej poprawnie zidentyfikować psy w 50% prób, podczas gdy modele trenowane wyłącznie na dźwiękach psów osiągnęły sukces na poziomie 24%.

Jest to istotne, ponieważ sugeruje, że znajomość ludzkiego języka może pomóc SI zrozumieć złożoność komunikacji nieludzkiej, unikając konieczności rozpoczynania od zera przy tworzeniu modelu do rozmowy ze zwierzętami (te oprogramowania pozwolą nam również rozmawiać z wielorybami).

„Nasze badanie pokazuje, że dźwięki i wzorce pochodzące z języka ludzkiego mogą służyć jako podstawa do analizy i zrozumienia wzorców akustycznych innych dźwięków, takich jak wokalizacje zwierząt”, wyjaśniła autorka badania, Rada Mihalcea. Następnie model był w stanie rozróżnić różne rasy psów z różnym poziomem sukcesu. Ponad połowa psów w badaniu to były chihuahua, a oprogramowanie zdołało je poprawnie zidentyfikować w około 75% przypadków.

Ostatecznie model został poddany próbie interpretacji znaczenia wokalizacji zwierząt, dopasowując je do jednego z 14 typów dźwięków wymienionych przez badaczy. Gdy był wstępnie wytrenowany na ludzkim głosie, SI osiągnęła poziom sukcesu wynoszący 62,2%, przy czym niektóre kategorie dźwięków były łatwiejsze do rozszyfrowania niż inne.

Na przykład model poprawnie zidentyfikował 90,7% negatywnych warczeń, ale tylko 45,26% negatywnych dźwięków. „Wciąż jest wiele rzeczy, których nie wiemy o zwierzętach, które dzielą z nami świat. Postępy w SI mogą zrewolucjonizować nasze rozumienie komunikacji zwierząt, a nasze wyniki sugerują, że nie musimy zaczynać od zera”, podsumowała Mihalcea.