GPU Lengan Mali-G77 - selok dan keluar yang lengkap

Pengarang: Randy Alexander
Tarikh Penciptaan: 3 April 2021
Tarikh Kemas Kini: 1 Julai 2024
Anonim
GPU Lengan Mali-G77 - selok dan keluar yang lengkap - Teknologi
GPU Lengan Mali-G77 - selok dan keluar yang lengkap - Teknologi

Kandungan


Di samping teras CPU Cortex-A77 baru, Arm telah melancarkan GPU generasi akan datang yang ditakdirkan untuk SoCs telefon pintar generasi akan datang. The Mali-G77, yang tidak dikelirukan dengan pemproses paparan Mali-D77 yang baru, menandakan pemergian seni bina Arm's Bifrost dan bergerak ke Valhall.

Kami akan masuk ke butiran seni bina baru seketika. Pertama, kita akan melompat ke dalam apa yang diharapkan pengguna dari segi prestasi prestasi.

Gambaran keseluruhan prestasi Mali-G77

Lengan mempunyai peningkatan prestasi grafik 40 peratus dengan peranti Mali-G77 gen berbanding dengan model Mali-G76 hari ini. Nombor ini mengambil kira proses dan juga penambahbaikan seni bina. The Mali-G77 boleh dikonfigurasikan dari 7 hingga 16 teras shader, dan setiap teras hampir sama dengan saiz teras G76. Ini bermakna bahawa telefon pintar mewah mungkin akan membawa kiraan teras GPU seperti yang mereka lakukan hari ini - di tempat remaja yang rendah. Mudah-mudahan, ini membolehkan kami membuat beberapa penilaian prestasi spekulatif terhadap chipset sedia ada.


Melihat penanda aras Manhattan GFXBench yang popular, peningkatan prestasi 40 peratus membuka peluang yang besar terhadap perkakasan generasi terkini. Cip Adreno generasi akan datang memerlukan peningkatan prestasi pentingnya sendiri untuk mengekalkan tahap padang permainan. Jadual-jadual kelihatan berubah menjadi lengan Lengan.

Seni bina bijak, prestasi permainan meningkat 20 hingga 40%, manakala pembelajaran mesin mendapat peningkatan 60%

Berdasarkan pengeboman bola yang agak mentah ini, 10 teras Mali-G77 (konfigurasi yang sering kita lihat dari Huawei) kelihatan hampir pada kelebihan generasi generasi ini dalam perkakasan grafik mudah alih garisan. Konfigurasi teras 12, yang biasanya dilihat di Exynos Samsung, memberikan petunjuk utama untuk GPU terbaru Arm. Sudah tentu, tanda aras sebenar bergantung pada faktor lain, termasuk nod proses, memori cache GPU, konfigurasi memori LPDDR, dan jenis aplikasi yang anda uji. Jadi ambil graf di atas dengan garam yang besar.


Dari segi arsitektur baru sahaja, Arm menyatakan bahawa Mali-G77 menawarkan peningkatan purata 30 peratus kepada kecekapan tenaga dan kepadatan prestasi. Terdapat juga peningkatan sebanyak 60 peratus untuk aplikasi pembelajaran mesin, terima kasih kepada sokongan produk INT8 dot. Harapan prestasi permainan ditetapkan di mana-mana antara rangsangan 20 dan 40 peratus, bergantung kepada tajuk dan jenis beban kerja grafik yang ditawarkan.

Untuk memahami dengan tepat bagaimana Lengan telah mencapai peningkatan prestasi ini, mari kita mengambil menyelam yang lebih mendalam ke dalam seni bina.

Temui Valhall, pengganti Bifrost

Vahall adalah seni bina GPU skalar generasi kedua Arm. Ia adalah enjin pelaksanaan 16-wide-peluntur, yang pada dasarnya bermaksud GPU melaksanakan 16 arahan selari setiap kitaran, setiap unit pemprosesan, setiap teras. Itu lebih dari 4 dan 8 di Bifrost.

Ciri-ciri seni bina baru termasuk penjadualan arahan dinamik sepenuhnya dikendalikan dalam perkakasan dan satu set arahan baru yang mengekalkan kesetaraan operasi kepada Bifrost. Yang lain termasuk sokongan untuk format pemampatan AFBC1.3 Arm, FP16 menjadikan sasaran, rendering berlapis, dan output shader vertex.

The Mali-G77 mempunyai 33% lebih banyak matematik selari daripada G76.

Kunci untuk memahami perubahan seni bina utama dijumpai dengan memaparkan unit pelaksanaan di dalam teras. Bahagian GPU ini bertanggungjawab untuk mengira nombor.

Di dalam enjin pelaksanaan

Di Bifrost, setiap teras GPU mengandungi tiga enjin pelaksanaan atau dua dalam kes beberapa reka bentuk Mali-G52 yang lebih rendah. Setiap enjin mengandungi i-cache, daftar fail, dan unit kawalan warp. Di Mali-G72, setiap enjin mengendalikan 4 arahan setiap kitaran, yang meningkat kepada 8 dalam Mali-G76 tahun lepas. Sebarkan ketiga-tiga teras ini membolehkan 12 dan 24 titik terapung 32-bit (FP32) menyambungkan berbilang-terkumpul (FMA) arahan setiap kitaran.

Dengan Valhall dan Mali-G77, hanya satu enjin pelaksanaan dalam setiap teras GPU. Seperti dahulu, enjin ini menempatkan unit kawalan warp, daftar, dan icache, yang kini dikongsi di dua unit pemprosesan. Setiap unit pemprosesan mengendalikan 16 arahan perputaran setiap kitaran, untuk jumlah keseluruhan 32 arahan FP32 FMA bagi setiap teras. Itulah rangsangan 33 peratus untuk mengendalikan arahan melalui Mali-G76.

Lengan telah beralih dari tiga kepada hanya satu unit pelaksanaan setiap teras GPU, tetapi kini terdapat dua unit pemprosesan dalam teras G77.

Di samping itu, setiap unit pemprosesan ini mengandungi dua blok fungsi matematik baru. Unit penukar baru (CVT) mengendalikan integer asas, logik, cawangan, dan arahan penukaran. Unit fungsi khas (SFU) mempercepatkan perkalian integer, bahagian, akar kuadrat, logaritma, dan fungsi integer kompleks yang lain.

Unit FMA standard telah melihat beberapa tweak, menyokong 16 arahan FP32 per kitaran, 32 FP16, atau 64 arahan produk INT8 dot. Pengoptimuman ini menghasilkan peningkatan prestasi 60 peratus dalam aplikasi pembelajaran mesin.

Mapper Quad Texture

Perubahan utama yang lain dalam Mali-G77 ialah pengenalan pemetaan tekstur quad, naik dari mapper dua tekstur pada generasi terdahulu. Pemetaan tekstur bertanggung jawab untuk memetakan poligon 3D dalam adegan ke dalam perwakilan 2D yang anda lihat pada layar. Ia bertanggungjawab untuk pensampelan, penyambungan, dan penapisan untuk melicinkan kandungan bersudut dan bergerak untuk mengelakkan tepi yang keras dan berkualiti rendah.

Anti-aliasing kos rendah tetap ada untuk membantu kualiti imej, tetapi peningkatan tekstur dua kali ganda adalah manfaat utama di sini. Unit tekstur kini memproses 4 titer bilinear setiap jam dari 2 sebelumnya, 2 tilel trilinear setiap jam, dan mengendalikan penapisan FP16 dan FP32 dengan lebih cepat.

Pemetaan tekstur quad dipecah menjadi dua laluan, menyediakan saluran paip yang lebih pendek untuk benang yang memukul kandungan dalam cache. Jalan yang hilang, yang mengendalikan penukaran format dan penyahmampatan tekstur, mempunyai antara muka yang lebih luas untuk cache L2. Ini juga berguna untuk beban kerja mesin pembelajaran yang mungkin perlu menarik data baru dari ingatan.

Membawa semuanya bersama-sama di Mali-G77

Lengan telah membuat beberapa tweak lain untuk Mali-G77 untuk bertepatan dengan perubahan besar dalam seni bina Valhall. Blok kawalan disederhanakan terima kasih kepada reka bentuk unit eksekusi tunggal, manakala scheduler dinamik dalaman sebenarnya membenarkan arahan yang lebih fleksibel mengeluarkan di dalam setiap teras. Dengan keupayaan yang lebih tinggi dalam setiap teras, datapath juga lebih pendek dan rendah dalam kependaman, hingga hanya 4-kitaran dari 8 sebelumnya.

Reka bentuk baru juga lebih baik disejajarkan dengan API Vulkan, memudahkan deskriptor pemandu untuk menurunkan beban pemandu untuk meningkatkan prestasi "ke logam".

Ringkasnya, Mali-G72 dan Valhall membuat perubahan penting dari Bifrost yang menjanjikan peningkatan prestasi yang signifikan untuk aplikasi permainan dan pembelajaran mesin. Yang penting, reka bentuk sesuai dalam kuasa dan belanjawan kawasan yang sama seperti Bifrost, memastikan bahawa peranti mudah alih dapat menawarkan lebih banyak prestasi puncak tanpa perlu risau tentang haba, kuasa, dan biaya silikon. Berdasarkan kepada unjuran prestasi, Mali-G77 sepatutnya dapat memberikan Adreno gen-gen Qualcomm yang baik untuk wangnya.

Pembaikan Google Pixel 3 telah menjadi edikit mimpi ngeri ejak peranti dilancarkan pada bulan Oktober 2018. Tidak eperti Pixel dan Pixel 2, anda tidak boleh melelefon di Pixel 3 anda ke puat pembaikan...

iri Google Pixel 3 mendapat gong dalam Anugerah Terbaik Android 2018 terima kaih kepada bukti fotografi komputainya. Malangnya, nampaknya kamera hebat dan kema kini panta tidak mencukupi untuk meningk...

Penerbitan Yang Menarik