markup logo

707

Huawei Ascend 910: NVIDIA-ს ხელოვნური ინტელექტის პლატფორმის ჩინური ალტერნატივა

კონფერენცია Hot Chips 31-ზე კომპანია Huawei-მ წარადგინა მსოფლიოში ერთ-ერთი უმძლავრესი პროცესორი ხელოვნური ინტელექტის ბაზაზე – Ascend 910. ამგვარი პროცესორები ნებისმიერი მწარმოებლისთვის მიღწევაა, თუმცა ყველა ვერ ბედავს თავისი ქმნილება მოწინავე NVIDIA-სა და INTEL Xeon-ს შეადაროს.NVIDIA-მ ერთ-ერთმა პირველმა დაიწყო თავისი გრაფიკული არქიტექტურის მოდიფიკაცია მანქანური სწავლების სფეროში გამოსაყენებლად.

Huawei მიიჩნევს, რომ საკუთარი პლატფორმებით თავისუფლად შეუძლია გახდეს NVIDIA-ს ალტერნატივა სულ მცირე ჩინურ ბაზარზე მაინც. იგი აპირებს გამოუშვას მილიონობით პროცესორი მანქანური სწავლებისათვის.

ზემოთხსენებულ პროცესორ Ascend 910-ს უშვებს კომპანია TSMC მეორე თაობის 7-ნანომეტრიანი ტექნოლოგიით (7+ EUV). ეს ტექნოპროცესი ხასიათდება EUV სკანერების გამოყენების მეშვეობით ჩიპის რამდენიმე შრის დასამზადებლად. კონფერენციაზე Huawei-მ Ascend 910 შეადარა NVIDIA Volta-ს, რომელიც გამოშვებულია TSMC-ს მიერ 12-ნანომეტრიანი FinFET ტექნოლოგიით. ზედა ფოტოზე წარმოდგენილია Ascend 910-სა და Volta-ს მონაცემები 12-ნანომეტრიანი ნორმალიზებით. კრისტალზე Huawei-ს პროდუქტის ფართობი 2.5-ჯერ მეტია NVIDIA-ზე, თუმცა Ascend 910-ის წარმადობა 4.7-ჯერ მაღალია NVIDIA-ს არქიტექტურა Volta-ზე.

Huawei თავის არქიტექტურას მასშტაბირების მეტად მაღალ დონეს მიაწერს. DaVinci-ბირთვები, რომლებიც საფუძვლად უდევს Ascend 910-ს, შესაძლებელია გამოიშვას სკალური ოპერირების სიდიდეების კონფიგურაციებად (16), ვექტორებად (16 ხ 16) და მატრიცული სახით (16 × 16 × 16). ეს კი იმას ნიშნავს, რომ მოცემული არქიტექტურა და DaVinci ბირთვები გამოჩნდება ინტერნეტ-ნივთების აბსოლუტურად ყველა სპექტრში.

Ascend 910-ისთვის განკუთვნილი DaVinci ბირთვი მაქსიმალურ კონფიგურაციაში შეიცავს 4096 Cube ბლოკს ნაწილობრივი გამოთვლისთვის (FP16). ბირთვის შემადგენლობაში ასევე შედის სკალარული და ვექტორული სიდიდეების გამომთვლელი სპეციალიზებული ბლოკები. 32 DaVinci ბირთვის მქონე Ascend-ის უმაღლესი წარმადობა FP16 გამოთვლებში 256 ტერაფლოპსს აღწევს, მთელი რიცხვების გამოთვლებში კი – 512 ტერაფლოპსს. ამ დროს მოხმარებული ენერგია 350 ვატს შეადგენს. ტენსორული ბირთვების მქონე NVIDIA-ს ალტერნატიული პროდუქტის მაჩვენებელი მაქსიმუმ 125 ტერაფლოპსია FP16-ზე.

DaVinci ბირთვების გარდა Ascend 910-ის კრისტალზე კიდევ რამდენიმე ბლოკია, მათ შორის მეხსიერების კონტროლერი HBM2 და 128-არხიანი ძრავი ვიდეონაკადების დეკოდირებისთვის. მძლავრი ჩიპი input/output ოპერაციებისათვის – Nimbus V3 – ცალკე კრისტალზეა წარმოდგენილია. ჯამში ყველა კრისტალის ფართობი 1228 მმ2-ს შეადგენს.

2048 ნოუდისგან შემდგარი კლასტერების ჯამური წარმადობა 512 პეტაფლოპსია FP16 ოპერაციებში. NVIDIA DGX Superpod-ის მაჩვენებელი 96 ნოუდისგან შემდგარი ნაკრების შემთხვევაში 9.4 პეტაფლოპსია. განსხვავება შესამჩნევია, თუმცა განვითარების სტიმულს იძლევა.

კატეგორია:

კომენტარის დატოვება