プロセッサ

DSP(デジタル・シグナル・プロセッサ) – コア・ベンチマーク

以下の表に示すベンチマークは、シングルコアを対象にしています。マルチコアの性能については、デバイス・ベンチマークをご覧ください。

すべてのベンチマークは、データを L2 SRAM に配置した状態で測定したものです。
1 C66x FFT コードのベンチマークは、L2 メモリを使用した FFTLIB に基づき、最適化したバージョンの FFT カーネル・コードで測定したものです。
2 データを OCMC RAM 内に配置した状態での A15 ベンチマーク。データとプログラム・キャッシュを有効にしてあります。ARM Neon 最適化で使用したコンパイラ・フラグは、-mfpu = vfpv4 –mfloat-abi = hard -03 です。A15 出力の正確さと精度に関する検証は行われていません。コード内では、手動で作成した固有命令を使用していません。

プロセッサ・コア C66x DSP コア C674x DSP コア ARM® Cortex®-A15  
使用したハードウェア・プラットフォーム C6657 評価モジュール C6748 LCDK AM5728 評価モジュール  
ベンチマーク対象のコアを搭載したデバイス C66x DSP
66AK2x DSP
Sitara AM57x SoC
OMAP-L138
C6748
66AK2x DSP
Sitara AM57x SoC
 
ベンチマーク対象の機能 C66x の実行時間 C674x の実行時間 ARM Cortex-A15 の実行時間2 関連する TI ライブラリ
C66x サイクル数 C66x μS@1GHz C674x サイクル数 C674x μS@456MHz Cortex-A15 サイクル数 Cortex-A15 μS@1GHz2
複素 FFT(256 点) - SP 浮動小数点1 1782 1.78 2401 5.27 8644 8.64 C66x 向けの FFTLIB
C674x 向けの DSPLIB
複素 FFT(1000点) - SP 浮動小数点1 6269 6.27 10950 24.01 43916 43.92
実数ブロック FIR - 固定小数点 128 サンプル、16 係数 262 0.26 386 0.85 2152 2.15 DSPLIB
実数ブロック FIR - SP 浮動小数点 128 サンプル、16 係数 1345 1.35 1406 3.08 6971 6.97 DSPLIB
実数ブロック FIR - SP 浮動小数点 256 サンプル、16 係数 2625 2.63 2735 6 13879 13.88 DSPLIB
複素ブロック FIR - SP 浮動小数点 64 サンプル、16 係数 1334 1.33 2221 4.87 13039 13.04 DSPLIB
複素ブロック FIR - SP 浮動小数点 128 サンプル、16 係数 2646 2.65 4397 9.64 26072 26.07 DSPLIB
実数行列 SGEMM 16x16 2405 2.41 3505 7.69 14662 14.66 DSPLIB
複素行列 SGEMM 16x16 4113 4.11 10884 23.87 26388 26.39 DSPLIB
行列演算 DGEMM 16x16 5061 5.06 -- -- 14669 14.67 DSPLIB
自己相関 - 固定小数点 N=32、IMG_corr_3x3_i16s_c16s 140 0.14 189 0.41 946 0.95 IMGLIB
ArcTan2 - SP 浮動小数点 24 0.02 31 0.07 49 0.05 MATHLIB
Log10 - 単精度(SP) 14 0.01 18 0.04 56 0.06 MATHLIB
Square Root(平方根) - 単精度浮動 6 0.01 6 0.01 5 0.01 MATHLIB

TI のハードウェアでこれらのベンチマークを再現する方法については、TI DSP Benchmarking(英語)アプリケーション・ノートをダウンロードしてください。

これらのチャートは、上記のベンチマーク情報に基づいて、選択したルーチンに対するコアの相対的な性能を示すものです。

C66x DSP コアの性能を C674x DSP コアと比較する次のチャートでは、C674x の性能を 1 として正規化を行いました。C66x コアの性能は、C674x を基準とする相対値で示してあります。この比較では、プロセッサの速度を考慮に入れています。

C66x DSP コアと C674x DSP コアの性能比較

* 複素 FFT、1000 点、単精度浮動小数点。
** 複素ブロック FIR、単精度浮動小数点、128 サンプル、16 係数。
*** 複素行列 SGEMM 16x16。

C66x DSP コア、C674x DSP コア、ARM Cortex-A15 コアの性能を比較する次のチャートでは、Cortex-A15 の性能を 1 として正規化を行いました。C66x コアの性能と C674x コアの性能は、Cortex-A15 を基準とする相対値で示してあります。この比較では、プロセッサの速度を考慮に入れています。

C66x DSP コア、C674x DSP コア、ARM Cortex-A15 コアの性能比較

* 複素 FFT、1000 点、単精度浮動小数点。
** 複素ブロック FIR、単精度浮動小数点、128 サンプル、16 係数。
*** 複素行列 SGEMM 16x16。