Arm Cortex-A77 - semua yang anda perlu ketahui

Pengarang: Randy Alexander
Tarikh Penciptaan: 2 April 2021
Tarikh Kemas Kini: 1 Julai 2024
Anonim
What is the ARM Cortex-A75? - Gary explains
Video.: What is the ARM Cortex-A75? - Gary explains

Kandungan


Bersama dengan pemproses grafik Mali-G77 baharu dan pemproses paparan Mali-D77, Arm telah melancarkan reka bentuk CPU berkinerja tinggi terbarunya - Cortex-A77. Seperti tahun lepas Cortex-A76, Cortex-A77 direka untuk aplikasi peringkat premium yang menuntut penggunaan kuasa rendah Arm. Segala-galanya dari telefon pintar sampai dengan komputer riba dan agak mungkin di luar.

Dengan Cortex-A77, Lengan telah menargetkan arahan maksimum setiap peningkatan kitaran / jam (IPC) dapat dikendalikan melalui Cortex-A76. Frekuensi jam, penggunaan kuasa, dan kawasan, semuanya direka bentuk untuk tetap berada di tempat yang sama, tetapi teras baru dapat mengatasi lebih banyak arahan sekaligus. Untuk melakukan ini, Lengan telah merancang teras yang lebih luas daripada tahun lepas dan telah membuat beberapa penambahbaikan untuk memastikan inti CPU diberi makan dengan perkara yang perlu dilakukan. Tetapi sebelum kita sampai ke situ, mari kita menyelam ke dalam gambaran peringkat tinggi dan nombor prestasi.


Memukul sasaran prestasi

Kembali pada bulan Ogos 2018, Arm secara tidak sengaja berkongsi pelan laluan CPU hingga 2020. Dari 2016 Cortex-A73 hingga 2020 "Hercules" reka bentuk, syarikat itu menjanjikan peningkatan 2.5x dalam prestasi pengiraan. Sebilangan besar unjuran yang besar ini dicapai dengan peralihan mikro arkitek utama dengan Cortex-A76, kelajuan jam moden yang lebih tinggi, dan bergerak dari 16 hingga 10 dan kini pembuatan 7nm dengan 5nm untuk diikuti. Kira-kira 1.8x keuntungan jalanraya telah dicapai oleh tahun lepas, dan Cortex-A77 menyediakan lebih kurang 20 peratus lagi rangsangan IPC. Ini meletakkan kami dengan baik dalam perjalanan ke sasaran 2.5x Arm, walaupun peranti mudah alih dengan kuasa terhad dan belanjawan termal tidak mengharapkan untuk melihat semua keuntungan ini.

Sebagai perbandingan, Cortex-A76 tahun lepas memberikan sekitar 30-35 peratus peningkatan berbanding Cortex-A75. Tahun ini, kita melihat keuntungan IPC yang lebih rendah, namun masih signifikan, 20 peratus antara A77 dan A76. Ini adalah berita baik kerana ia bermakna lebih banyak prestasi sambil berpegang kepada kekangan terma dan kekuasaan yang sama seperti sebelumnya. The trade-off adalah bahawa A77 adalah sekitar 17 peratus lebih besar daripada A76, jadi akan dikenakan biaya lebih sedikit dari segi kawasan silikon. Sekiranya anda mahukan perbandingan dengan pemimpin desktop, AMD mengurus 15 peratus peningkatan IPC antara Zen2 dan Zen +, manakala IPC Intel kekal hampir statik selama bertahun-tahun.Sudah tentu kita bercakap tentang segmen pasaran yang berbeza di sini, tetapi ini menunjukkan bagaimana pasukan reka bentuk CPU Arm telah membuat keuntungan yang hebat dalam generasi baru-baru ini.


Rangsangan prestasi 20% ditawarkan untuk SoCs berdasarkan Cortex-A77 gen seterusnya

Takeaway di sini adalah bahawa A76 menandakan peralihan mikro arkitek utama dengan keuntungan prestasi yang besar, sementara kami kembali ke tahap peningkatan pengoptimuman dengan A77. Dengan cara itu, mari kita menyelami apa yang baru dalam Arm Cortex-A77.

Cortex-A77 dibina pada arkitek mikro A76

Kunci untuk memahami perbezaan antara Cortex-A77 dan A76 adalah untuk memahami apa yang dimaksudkan dengan reka bentuk teras yang lebih luas. Pada asasnya, kita bercakap keupayaan untuk melaksanakan lebih banyak arahan untuk setiap kitaran jam, yang meningkatkan daya teras. Terdapat dua bahagian penting untuk mendapatkan hak ini - meningkatkan bilangan unit pelaksanaan untuk melakukan pemprosesan dan memastikan unit-unit ini disimpan dengan baik dengan data. Mari kita mulakan dengan bahagian yang terakhir dan tumpukan pada bahagian penghantaran, cache, dan peramal cawangan SoC.

Cortex-A77 melihat rangsangan 50 peratus untuk penghantaran lebar, sehingga enam arahan setiap kitaran daripada empat dengan A76. Ini bermakna lebih banyak arahan menuju teras pelaksanaan untuk setiap kitaran jam untuk potensi prestasi yang lebih besar. Tetingkap pelaksanaan luar pesanan juga lebih besar hasilnya, meningkat kepada 160 entri untuk mendedahkan lebih banyak paralelisme. Terdapat 64k arahan-cache biasa, manakala Penargetan Sasaran Cawangan (BTB), yang memegang alamat untuk peramal cawangan, adalah 33 peratus lebih besar daripada sebelumnya untuk menangani pertumbuhan dalam arahan selari. Tiada apa yang luar biasa di sini, ia pada dasarnya adalah versi yang lebih luas daripada reka bentuk tahun lepas.

Penambahan depan yang lebih menarik adalah 1.5K MOP cache yang baru, yang menyimpan makro-Ops (MOPs) yang diberi makan kembali dari unit decode. Senibina CPU lengan menghuraikan arahan daripada aplikasi pengguna ke operasi makro yang lebih kecil dan kemudian turun lagi ke dalam mikro-ops bahawa inti eksekusi memahami. Anda dapat melihat ini di atas rajah di bahagian decode. Cakera MOP digunakan untuk mengurangkan penalti kos cawangan yang tidak terjawab dan flushes, kerana anda terus memegang makro-ops daripada menyahkodkannya sekali lagi, dan meningkatkan keseluruhan keseluruhan teras teras. Mengambil daripada MOP daripada i-cache memintas tahap decoded, menyimpan satu kitaran. Lengan menyatakan bahawa cache MOP boleh mencecah 85 peratus atau lebih kadar hit merentasi pelbagai beban kerja, menjadikannya tambahan yang sangat berguna untuk i-cache standard.

Bergerak ke bahagian inti eksekusi CPU, perhatikan penambahan unit ALU keempat dan Cawangan kedua. ALU yang keempat ini meningkatkan jumlah band pensjal angka pemproses sebanyak 50 peratus. ALU tambahan ini mampu arahan satu kitaran asas (seperti ADD dan SUB) ditambah operasi integer dua siklus seperti pendaraban. Dua daripada ALU yang lain hanya boleh mengendalikan arahan kitaran asas, manakala unit akhir dikenakan dengan operasi matematik yang lebih maju seperti pembahagian, membiak-berkumpul, dan lain-lain. Unit cawangan kedua di dalam teras pelaksanaan merangkumi bilangan cawangan serentak melompat teras boleh mengendalikan, yang berguna dalam keadaan di mana dua dari enam arahan yang dihantar adalah cawangan melompat. Ini kedengaran sedikit pelik, tetapi ujian dalaman di Arm menunjukkan keuntungan prestasi daripada mengadopsi unit kedua ini.

The Cortex-A77 menawarkan paralelisme yang lebih baik dan pengambilan baru pada cache awal

Tweak lain ke teras CPU termasuk penambahan saluran paip penyulitan AES kedua. Talian saluran data-menyimpan kini mempunyai port isu khusus untuk menggandakan jalur lebar masalah memori. Pelabuhan-pelabuhan ini sebelum ini dikongsi bersama ALU, yang kadang-kadang boleh menjadi hambatan. Terdapat juga perfecter data generasi akan datang untuk meningkatkan kecekapan tenaga sambil meningkatkan lebar jalur ke sistem DRAM.

Sebahagian daripada sistem ini dalam Cortex-A77 juga mempunyai sistem prefetch "sistem yang sedar" yang baru. Ini meningkatkan prestasi ingatan berdasarkan pelbagai kiraan teras CPU, kapasiti cache dan latency, dan konfigurasi sub-sistem ingatan dalam peranti akhir. Perkakasan berdedikasi untuk berbincang dengan Unit Penjadualan Dinamik (DSU) sebagai sebahagian daripada kelompok DynamIQ CPU, yang memantau penggunaan cache L3 yang dikongsi. Ciri terasnya mempunyai jarak dinamik dan tahap agresif untuk mengurangkan penggunaan cache dalam situasi di mana lebar jalur L3 dihadkan oleh teras CPU yang lain. Core prestasi yang lebih tinggi seperti Cortex-A77 lebih cenderung untuk menembusi akses DSU ke memori, manakala teras kuasa rendah seperti A55 tidak mungkin.

Selesaikan semuanya

Terdapat banyak perubahan kecil pada Cortex-A77 yang menambah beberapa perbezaan besar kepada pendahulunya. Singkatnya, cache MOP baru A77s yang digabungkan dengan tetingkap arahan yang lebih luas dan lebih lama membantu memastikan ALU, Cawangan, dan unit ingatan yang sibuk dengan perkara-perkara yang perlu dilakukan. Reka bentuk Cortex-A76 kuasa telah diperluas untuk meningkatkan daya tampungnya lebih jauh lagi dengan A77, tanpa bergantung pada kelajuan jam yang lebih tinggi.

Peningkatan prestasi terbesar kepada Cortex-A77 tiba dalam bentuk matematik titik integer dan terapung. Ini disahkan oleh tanda aras dalaman Arm, yang mempamerkan peningkatan prestasi 20 hingga 35 peratus dalam integer SPEC dan penanda aras terapung masing-masing. Penambahbaikan jalur lebar memori berada di antara 15 dan 20 peratus, sekali lagi menunjukkan bahawa keuntungan terbesar datang dalam bentuk crunching nombor. Secara keseluruhannya, peningkatan ini memberi A77 peningkatan purata 20 peratus berbanding generasi terdahulu. Kami juga mungkin melihat beberapa keuntungan lebih kecil lagi hasil daripada proses pembuatan 7nm yang lebih maju pada akhir tahun ini atau awal tahun 2020.

Dari segi telefon pintar, SoCs berkuasa Cortex-A77 ditakdirkan untuk produk berprestasi tinggi, utama. Lengan sepenuhnya mengharapkan untuk melihat reka bentuk kuasa menggunakan 4 + 4 bit.LITTLE pengaturcaraan teras. Memandangkan peningkatan daya tampung dan bonggol sedikit ke saiz kawasan A77, kita mungkin akan melihat pereka SoC terus menurunkan trend 1 + 3 + 4 atau 2 + 2 + 4. Dengan satu atau dua teras besar yang kuat dengan cache besar dan jam yang lebih tinggi, disokong oleh 2 atau 3 teras A77 dengan saiz cache yang lebih kecil dan jam yang lebih rendah untuk menjimatkan kuasa dan kawasan. Akhirnya Cortex-A77 mantap perkara yang baik untuk cip telefon pintar dan pasaran yang semakin meningkat untuk komputer riba yang berasaskan lengan yang sentiasa disambungkan. Perhatikan pengumuman silikon pada tahun ini.

Xiaomi Mi Play pertama kali diumumkan pada bulan Diember, jadi debut globalnya jela lama berlanjutan. Kini, peranti itu telah ecara rami mendarat di Ukraine, yang menunjukkan bahawa pelancaran Eropah ...

Dalam atu majli akhbar di New Delhi, Xiaomi mengumumkan perkhidmatan pembayaran baru di India, Mi Pay. Mi Pay adalah perkhidmatan pembayaran mudah alih berdaarkan platform UPI negara....

Menarik