markup logo

298

ხელოვნურმა ინტელექტმა პირველად შეძლო საუბრის გარჩევა ხმაურში

ვირტუალურმა ასისტენტმა და ხმის ამომცნობმა სისტემამ საკმაოდ კარგად „შეისწავლეს“ რას ამბობს ადამიანი და როგორ დაემორჩილონ მათ ბრძანებას.
მაგრამ ისეთი ხმოვანი ასისტენტებისთვისაც კი, როგორიცაა Cortana и Apple Siri , დიდ პრობლემას ქმნის ზოგადი ხმაური. კომპანია Mitsubishi Electric ექსპერტებმა წარმოადგინეს ახალი ტექნოლოგია, რომელიც გადაჭრის ტექნიკური გაუმართაობის პრობლემას, როგორიცაა კონკრეტული ადამიანის საუბრის გამორჩევა ზოგადი ხმაურიდან.

იაპონური კომპანიის ტექნოლოგიამ მიიღო სახელი – Deep Clustering, რომლის ფუნქციონირება აგებულია მანქანების შესწავლის პრინციპებზე.
ხელოვნურმა ინტელექტმა დასაწყისისთვის შეისწავლა დამოუკიდებლად გამოარჩიოს ერთი ადამიანის საუბარი სხვადასხვა ხმების და ხმაურის ნაკადიდან.
ნეირონის ქსელი აცალკევებს შემოსულ აუდიომონაცემებს სხვადასხვა ელემენტებზე და სათითაოდ უტარებს ანალიზს, რის შემდეგაც შეუძლია კონკრეტული ადამიანის ხმის დამუშავება. ასეთი სამუშაო სრულდება ორი ან მეტი თანამოსაუბრის დროსაც.

იაპონური კომპანიის ტექნოლოგიური მიღწევის დემონსტრირების დროს სისტემამ წარმატებით გამოყო ორი ადამიანის საუბარი, რომლებიც ერთი და იგივე დროს, ერთ მიკროფონში საუბრობდნენ სხვადასხვა ენაზე.
ტექსტის დამუშავება მიდიოდა რეალურ დროში და შეფერხება სამ წამს არ აღემატებოდა.
ზუსტი ამოცნობა შეადგენდა 90%, და როდესაც უკვე სამმა ადამიანმა დაიწო საუბარი მიკროფონში, სიზუსტის პროცენტი 80% ჩამოვიდა, რომელიც ძალიან კარგი მაჩვენებელია.

ამ ტექნოლოგიის გამოყენება შესაძლებელია იმ სფეროში, სადაც საჭიროა მაღალი სიზუსტე ხმოვანი შეტყობინებების ამოსაცნობად. მაგალითად მანქანების ხმოვანი მართვის სისტემებში, ლიფტებში, საყოფაცხოვრებო ტექნიკის და სხვა ელექტრონული მოწყობილობებისთვის.

კატეგორია:

კომენტარის დატოვება