コア・ベンチマーク
以下の表に示すベンチマークは、シングルコアを対象にしています。マルチコアの性能については、デバイス・ベンチマークをご覧ください。
プロセッサ・コア | C66x DSP コア | C674x DSP コア | ARM® Cortex®-A15 | ||||
---|---|---|---|---|---|---|---|
使用したハードウェア・プラットフォーム | C6657 評価基板 | C6748 LCDK | AM5728 EVM | ||||
ベンチマーク対象のコアを搭載したデバイス | |||||||
ベンチマーク対象の機能 | C66x の実行時間 | C674x の実行時間 | ARM Cortex-A15 の実行時間2 | 関連する TI ライブラリ | |||
C66x のサイクル | C66x μS @ 1GHz | C674x のサイクル | C674x μS @ 456MHz | Cortex-A15 のサイクル | Cortex-A15 μS @ 1GHz2 | ||
複素 FFT(256 点) - SP 浮動小数点 1 | 1782 | 1.78 | 2401 | 5.27 | 8644 | 8.64 | DSPLIB |
複素 FFT(1k 点) - SP 浮動小数点 1 | 6269 | 6.27 | 10950 | 24.01 | 43916 | 43.92 | DSPLIB |
実数ブロック FIR - 固定小数点 128 サンプル、16 係数 | 262 | 0.26 | 386 | 0.85 | 2152 | 2.15 | DSPLIB |
実数ブロック FIR - SP 浮動小数点 128 サンプル、16 係数 | 1345 | 1.35 | 1406 | 3.08 | 6971 | 6.97 | DSPLIB |
実数ブロック FIR - SP 浮動小数点 256 サンプル、16 係数 | 2625 | 2.63 | 2735 | 6 | 13879 | 13.88 | DSPLIB |
複素ブロック FIR - SP 浮動小数点 64 サンプル、16 係数 | 1334 | 1.33 | 2221 | 4.87 | 13039 | 13.04 | DSPLIB |
複素ブロック FIR - SP 浮動小数点 128 サンプル、16 係数 | 2646 | 2.65 | 4397 | 9.64 | 26072 | 26.07 | DSPLIB |
実数行列 SGEMM 16x16 | 2405 | 2.41 | 3505 | 7.69 | 14662 | 14.66 | DSPLIB |
複素行列 SGEMM 16x16 | 4113 | 4.11 | 10884 | 23.87 | 26388 | 26.39 | DSPLIB |
行列演算 DGEMM 16x16 | 5061 | 5.06 | 14669 | 14.67 | DSPLIB | ||
自己相関 - 固定小数点 N=32、IMG_corr_3x3_i16s_c16s | 140 | 0.14 | 189 | 0.41 | 946 | 0.95 | IMGLIB |
ArcTan2 - SP 浮動小数点 | 24 | 0.02 | 31 | 0.07 | 49 | 0.05 | MATHLIB |
Log10 - 単精度(SP) | 14 | 0.01 | 18 | 0.04 | 56 | 0.06 | MATHLIB |
Square Root(平方根) - 単精度浮動 | 6 | 0.01 | 6 | 0.01 | 5 | 0.01 | MATHLIB |
すべてのベンチマークは、データを L2 SRAM に配置した状態で測定したものです。
1 C66x FFT コードのベンチマークは、L2 メモリを使用した FFTLIB に基づき、最適化したバージョンの FFT カーネル・コードで測定したものです。
2 データを OCMC RAM 内に配置した状態での A15 ベンチマーク。データとプログラム・キャッシュを有効にしてあります。ARM Neon 最適化で使用したコンパイラ・フラグは、-mfpu = vfpv4 –mfloat-abi = hard -03 です。A15 出力の正確さと精度に関する検証は行われていません。コード内では、手動で作成した固有命令を使用していません。
これらのチャートは、上記のベンチマーク情報に基づいて、選択したルーチンに対するコアの相対的な性能を示すものです。
C66x DSP コアの性能を C674x DSP コアと比較する次のチャートでは、C674x の性能を 1 として正規化を行いました。C66x コアの性能は、C674x を基準とする相対値で示してあります。この比較では、プロセッサの速度を考慮に入れています。
TI のハードウェアでこれらのベンチマークを再現する方法については、TI DSP Benchmarking(英語)アプリケーション・ノートをダウンロードしてください。
C66x DSP コアと C674x DSP コアの性能比較
* 複素 FFT、1000 点、単精度浮動小数点。
** 複素ブロック FIR、単精度浮動小数点、128 サンプル、16 係数。
*** 複素行列 SGEMM 16x16。
C66x DSP コア、C674x DSP コア、Arm®Cortex®-A15 コアの性能を比較する次のチャートでは、Cortex®-A15 の性能を 1 として正規化を行いました。C66x コアの性能と C674x コアの性能は、Cortex®-A15 を基準とする相対値で示してあります。この比較では、プロセッサの速度を考慮に入れています。
C66x DSP コア、C674x DSP コア、Arm® Cortex®-A15 コアの性能比較
* 複素 FFT、1000 点、単精度浮動小数点。
** 複素ブロック FIR、単精度浮動小数点、128 サンプル、16 係数。
*** 複素行列 SGEMM 16x16。