DSPのメリット

DSPのメリットを演算速度だと考えると認識を誤ってしまいます。演算速度を言うのならば今はx86の方が高速ですしそれで足りなければPCクラスタを使う手があります。
DSPのメリットは次の式で表される演算密度指標が高いことです。

\fs{+2}\frac{S}{P*V}

ここでSは演算速度、Pは消費電力、Vは体積です。体積の替わりに面積を使うこともあります。演算密度に消費電力を入れるのは奇異に感じますが、低消費電力なデバイスは大規模並列化を行いやすいので有利です。
ざっと計算してみましょう。Pentium4 3400MHzが1クロックあたり16ビット演算を8MAC可能だとします。そうするとこのプロセッサの演算能力は27.2GMAC/Sです。一方でADSP-BF533/750Mhzは1.5GMAC/Sです。こうしてみると計算能力の差は圧倒的です。しかし計算密度指標はどうでしょうか。
まず体積を調べます。ミドルタワーケースの寸法を43cmx19cmx48cmとすると約39千立方センチ。一方でEZ-KITは底面18cmx14cm、高さ5cmくらいの箱に入りそうですが、公平のため電源用に高さ10cmの箱に入れると体積2.8千立方センチです。PCの消費電力を300W、EZ-KITの消費電力を6Wとすると先の演算密度指数は

Pentium4 : 27.2G / 39000 / 300 = 2.3MMACS/Wcm3
ADSP-BF533 : 1.5 / 2800 / 6 = 86.8MMACS/Wcm3

となり、圧倒的にBF533が有利になります。これは大規模並列システムの実装時に体積の*1ほか、電力の縛りが少ない*2といった利点があるほか、携帯機器のようにはじめから与えられた条件でシステムを設計する際に非常に影響力のあるファクターになります。
さて、それに加えて大規模演算システムで問題になるのがフォン・ノイマンボトルネックです。Pentium4のように内部にDMAを持たないシステムの場合、データのフェッチは不可避的にキャッシュ頼りとなり、ミスヒット時のペナルティーによって大きな演算能力低下が起きます。そして、そもそもキャッシュにヒットしてもデータのロードから演算までは遅延を伴い、ストールを避けることができません。また、演算間の依存性によるストールも非常に大きなものです。結果的にPCによる演算はあまり効率的なものではありません。DSPが重宝されるのはこういった点に細かく配慮されたアーキテクチャーだからです。
最近ちらっと気になっているのはIPフレックスのDAP/DNAです。これは演算エレメントを通信パスの中に埋め込むようなアーキテクチャーになっており、DSPでもフォン・ノイマンボトルネックが問題になるような画像処理をすんなりとやってくれそうな雰囲気です。同じようなアーキテクチャーを提唱している海外のメーカーもあります。将来どう化けるか楽しみです。

*1:例えばデータセンターなどは設置面積あたりのコストが高いので小さいシステムほど高付加価値になる

*2:当然ビルや地域の電力供給能力には上限がある