【手機(jī)評(píng)測(cè)】三星GALAXY S4(國(guó)際版)采用了三星最新的Exymos 5 Octa“雙四核”處理器。該處理器采用28nm工藝制程,基于ARM的ARM big.LITTLE/Cortex A15架構(gòu)(也就是所謂的大小核架構(gòu)),號(hào)稱(chēng)是一種低功耗,高性能的移動(dòng)處理器架構(gòu)。三星這塊處理器的特色是由兩個(gè)四核處理器組成,分別為1.8GHz的A15架構(gòu)處理器和1.2GHz的A7構(gòu)架處理器。接下來(lái)我們一起對(duì)三星這顆“雙四核”處理器架構(gòu)進(jìn)行解析。
三星“雙四核”big.LITTLE架構(gòu)特征分析
三星Exynos 5 Octa
三星Exynos 5 Octa八核芯片其實(shí)是由兩顆四核處理器封裝在一起。據(jù)三星解釋?zhuān)咝阅艿奶幚砥鲗⒂脕?lái)處理更加復(fù)雜的運(yùn)算,平時(shí)一般使用的時(shí)候則采用低性能的處理器,兩者可以根據(jù)使用情況不同進(jìn)行協(xié)同,因此也能有效降低功耗。
其中,Cortex-A7處理器是全新的架構(gòu),其結(jié)構(gòu)和功能集與Cortex-A15處理器完全相同,不同這處在于,Cortex-A7處理器的微體系結(jié)構(gòu)側(cè)重于提供最佳能效,因此這兩種處理器可在“大小核架構(gòu)”big.LITTLE配置中協(xié)同工作,從而提供高性能與超低功耗的終極組合。單個(gè)Cortex-A7處理器的能源效率是ARM Cortex-A8處理器的5倍,性能提升50%,而尺寸僅為后者的五分之一。
big.LITTLE架構(gòu)
big.LITTLE處理的設(shè)計(jì)旨在為適當(dāng)?shù)淖鳂I(yè)分配恰當(dāng)?shù)奶幚砥。Cortex-A15處理器是目前已開(kāi)發(fā)的性能最高的低功耗ARM處理器,而Cortex-A7處理器是目前已開(kāi)發(fā)的最節(jié)能的ARM應(yīng)用程序處理器。可以利用Cortex-A15處理器的性能來(lái)承擔(dān)繁重的工作負(fù)載,而Cortex-A7可以最有效地處理智能手機(jī)的大部分工作負(fù)載。這些操作包括操作系統(tǒng)活動(dòng)、用戶(hù)界面和其他持續(xù)運(yùn)行、始終連接的任務(wù)。
目前最常見(jiàn)的ARM架構(gòu)是ARM Cortex A9。此架構(gòu)的性能出色,最多支持4顆核心。然而,最早的4核心處理器Tegra 3從大規(guī)模出貨起已有了一年多的時(shí)間,已經(jīng)不能滿(mǎn)足安卓的軍備競(jìng)賽,在理論是上也不是高通Krait架構(gòu)的對(duì)手。因此某些廠(chǎng)商開(kāi)始使用目前性能最強(qiáng)的A15架構(gòu)。比如三星推出的Exynos 5250,已經(jīng)運(yùn)用在了Chromebook 和Nexus 10上。
但是A15架構(gòu)的功耗實(shí)在太大,放在手機(jī)上單獨(dú)使用顯然是不合適的,發(fā)熱嚴(yán)重和悲劇的續(xù)航將會(huì)是其噩夢(mèng),因此,big. Little 架構(gòu)開(kāi)始被關(guān)注應(yīng)用。三星Exynos Octa是由兩組四核處理器組成的,一組是四核Cortex A15,一組是四核Cortex A7,利用ARM最新發(fā)布的CCI-400連在一起工作?梢詫(shí)現(xiàn)兩組不同的四顆核心的切換,具體點(diǎn)就是在低強(qiáng)度任務(wù)下開(kāi)啟A7的四顆核心省電,在任務(wù)強(qiáng)度大的時(shí)候開(kāi)啟A15核心,用來(lái)取得強(qiáng)大的性能。
初期結(jié)構(gòu)存在問(wèn)題:任務(wù)轉(zhuǎn)換
big.LITTEL暫時(shí)來(lái)看是獲取高性能和提高續(xù)航的一種較好的解決架構(gòu),但初期仍然會(huì)存在一些問(wèn)題。那便是big little機(jī)制并不完美,a15和a7之間的異步,核心切換機(jī)制存在一定的繁瑣和復(fù)雜,如何判斷哪些時(shí)候用a15,什么時(shí)候用a7,用多少個(gè)a15,用多少個(gè)a7,在軟件支持等方面的機(jī)制尚需時(shí)日優(yōu)化。
任務(wù)轉(zhuǎn)移模式
big.LITTLE的最初階段,本是希望big core與LITTLE core數(shù)量相同。如果不是同樣數(shù)量的CPU核心,那么在任務(wù)轉(zhuǎn)移上無(wú)法迅速、簡(jiǎn)易地完成。要想在CPU核心之間進(jìn)行任務(wù)轉(zhuǎn)移,必須要將當(dāng)前狀態(tài)寫(xiě)入外部存儲(chǔ)器(指下一級(jí)緩存)中。因此需要將切換的時(shí)間控制到最小。實(shí)際應(yīng)用中雖然等待CPU核心響應(yīng)需要消耗時(shí)間,但這段時(shí)間正在執(zhí)行現(xiàn)有任務(wù)的核心依然在運(yùn)行,所以延遲被遮蓋住,不易察覺(jué)。
CPU核心之間由于任務(wù)切換,停止處理所花費(fèi)的時(shí)間僅僅是將要關(guān)閉的CPU核心的架構(gòu)狀態(tài)寫(xiě)入到緩存,然后等待原先關(guān)閉的CPU核心重新喚醒的時(shí)間。狀態(tài)保存需要的時(shí)間依照CPU核心的頻率不同,在600MHz時(shí)切換需要8.3μs。喚醒需要的時(shí)間相同。切換時(shí)的頻率越低,需要的時(shí)間越長(zhǎng)。根據(jù)ARM的解釋?zhuān)袚Q造成的停止響應(yīng)時(shí)間最短可以控制在20μs左右。
big.LITTLE的構(gòu)成中,L2緩存都為同種核心使用,big與LITTLE之間不共享。這是為了將LITTLE核心的緩存做小,已達(dá)到省電的目的。正因如此,才會(huì)在任務(wù)在兩種核心間切換時(shí)由于緩存的閃斷與預(yù)熱產(chǎn)生延遲時(shí)間,也正因此才在big.LITTLE上加入了隱蔽切換延遲的機(jī)構(gòu)。這就可以解釋有時(shí)候我們使用三星S4的時(shí)候,在一些大型軟件游戲之間切換存在延遲的原因。
新的任務(wù)處理模式不需要整體將應(yīng)用進(jìn)行轉(zhuǎn)移,而是根據(jù)任務(wù)對(duì)于CPU的負(fù)荷而進(jìn)行判斷,這是通過(guò)電壓和頻率的閥值而實(shí)現(xiàn)的。加入big核心的頻率下降到一定的程度,其便會(huì)出發(fā)LITTLE核心進(jìn)行接替。LITTLE向big的情況也就是反過(guò)來(lái),LITTLE的頻率提高到一個(gè)閾值,將觸發(fā)切換至big核心。事實(shí)上,big.LITTLE MP是ARM提供的非對(duì)稱(chēng)多核心運(yùn)行的模式,其需要對(duì)系統(tǒng)和軟件方面進(jìn)行改進(jìn),并不需要對(duì)硬件進(jìn)行變更,要求對(duì)任務(wù)運(yùn)行進(jìn)行規(guī)劃分配。這相對(duì)于任務(wù)之間的CPU核心整體轉(zhuǎn)移,效率提高了不少。
解決發(fā)展方向:基于核心轉(zhuǎn)換
初初big.LITTLE架構(gòu)出現(xiàn)時(shí),big與LITTLE的切換開(kāi)關(guān)只能做到基于簇(Cluster)的。例如四個(gè)CPU核心的Cortex-A15簇與四個(gè)CPU核心的Cortex-A7簇之間切換,以簇為單位的切換模式中,出現(xiàn)負(fù)荷高的任務(wù)時(shí),四核Cortex-A7核心都會(huì)轉(zhuǎn)換成高性能的Cortex-A15核心,導(dǎo)致效率低下。
三種工作模式
因而,后續(xù)的處理器如何調(diào)度將以CPU核心為單位切換,即是CPU Migration Use Model,當(dāng)中這種基于核心的切換使得big.LITTLE獲得顯著提升;贑PU核心的切換模式中,big簇的CPU核心與LITTLE簇中的CPU核心分別一對(duì)一地做為“一對(duì)”,以各“對(duì)”為單位切換。這樣一來(lái)執(zhí)行負(fù)荷高的任務(wù)時(shí),必要數(shù)量的CPU核心切換至big核心,剩下的依然由LITTLE核心執(zhí)行。可以比較效率地提高執(zhí)行能力與保證低耗電。
總結(jié)
big.LITTE架構(gòu)為三星“雙四核”所采用,這也是一種較為兼顧性能和功耗的解決方面。當(dāng)然這種架構(gòu)還是存在一個(gè)比較初級(jí)階段,仍然有需要優(yōu)化的空間,長(zhǎng)遠(yuǎn)來(lái)看有不錯(cuò)的前景。