DIGITAL BUYER

すべて分かった GeForce4 【特別企画】他人に聞かれても困らない
すべて分かった GeForce4

アスキー PC Explorerアスキー PC Explorer 2002年4月号
2002年4月20日


GeForce3によってPC用ビデオチップ業界で独走態勢に入ったかに見えたNvidiaだが、ライバルATIが「RADEON 8500/7500」によって巻き返しを図り、一部ベンチマークテスト等ではGeForce3を上回る結果を出した。それに対抗すべくNvidiaは2001年10月に高クロック版「GeForce3 Ti 500」を投入、さらに矢継ぎ早に今回の「GeForce4シリーズ」を発表し、台湾マザーボードメーカーを中心に採用ビデオカードが増えつつあるATI RADEON勢を一気に引き離しにかかった。

この記事は、アスキーPC Explorer 4月号(3月13日発売)の「他人に聞かれても困らない すべて分かった GeForce4」を転載したものです。 記事作成時期が3月初であるため、本稿内には「GeForce4 Ti」搭載カードの製品情報やベンチマーク結果が未掲載となっております。GeForce4 Ti搭載カードについてはこちらをご覧ください。

GeForce4 TiはGeForce3の
マイナーバージョンアップ

 GeForce4には、ハイスペックモデルの「GeForce4 Tiシリーズ」とコストパフォーマンスを重視した「GeForce4 MXシリーズ」の2ラインナップがある(表参照、このほかに、Mobile用途の「GeForce4 GOシリーズ」があるが本稿ではデスクトップ向けの2シリーズに絞って紹介する)。

 GeForce4 Tiの開発コードネームは「NV25」、GeForce4 MXは「NV17」。それに対して従来のGeForce3(Ti含む)が「NV20」、GeForce2 MXが「NV11」であることから分かるように、実はGeForce4シリーズは直前のビデオチップからのマイナーバージョンアップである。ただし、マイナーバージョンアップといっても、GeForce3→同 Tiのように単純に動作クロックを上げただけではない。GeForce4 TiについてはGeForce3で取り入れた新技術(メモリアクセスの高速化やピクセルシェーダ/バーテックスシェーダなど)をより機能強化させ、GeForce4 MXではGeForce2 MXからメモリアクセスの高速化を図りながら、コストアップを最小限に抑え、コストパフォーマンスのさらなる向上に努めている。

 では、具体的に強化点を見ていこう。

表1 GeForce4 Tiシリーズの主なスペック
名称 GeForce4 Ti 4600 GeForce4 Ti 4400 GeForce3 Ti 500 GeForce3
内部アーキテクチャ 256bit 256bit
メモリインターフェイス 128bit(DDR) 128bit(DDR)
メモリバンド幅 10.4GB/秒 8.8GB/秒 8.0GB/秒 7.4GB/秒
搭載可能メモリ容量 128MB 128MB
コアクロック 300MHz 275MHz 240MHz 200MHz
メモリクロック 325MHz/650MHz相当 275MHz/550MHz相当 250MHz/500MHz相当 230MHz/460MHz相当
内蔵RAMDAC 350MHz×2 350MHz
表2 GeForce4 MXシリーズの主なスペック
名称 GeForce4 MX 460 GeForce4 MX 440 GeForce4 MX 420 GeForce2 MX-400
内部アーキテクチャ 256bit 256bit
メモリインターフェイス 128bit(DDR) 128bit(SDR) 128bit(SDR)/64bit(DDR)
メモリバンド幅 8.8GB/秒 6.4GB/秒 2.7GB/秒 2.7GB/秒
搭載可能メモリ容量 64MB 64MB
コアクロック 300MHz 270MHz 250MHz 200MHz
メモリクロック 275MHz/550MHz相当 200MHz/400MHz相当 166MHz 166MHz/333MHz相当
内蔵RAMDAC 350MHz×2 350MHz

より高速化した
メモリアクセスとは?

 図1図2は、Nvidiaからの公式資料を基に、編集部で独自に予測したGeForce4 Ti/MXのブロック図である。ここでは説明しやすくするために3Dグラフィックス関連に絞っているが、実際にはこのほかに2Dグラフィックス(通常のウィンドウ表示など)やビデオ再生を高速化するための機能も盛り込まれている。

 最初に注目すべき点は、メモリアクセスを高速化した「Lightspeed メモリアーキテクチャII」だ。GeForce3に搭載された「Lightspeed メモリアーキテクチャ」の改良版である本機能、その特徴は4つに区分けされたメモリコントローラ&キャッシュにある。ビデオメモリとのバスは128bitで変わりないが、テクスチャデータなど大きなデータは128bitの連続したデータとして読み込み、ピクセルデータを書き込む場合には32bitずつ最大4つのデータを同時に出力する、といった具合に用途に応じてメモリアクセスを最適化できる。例えて言えば、従来は大型バスが1台で行き来していて、1人でも100人でも1クロックで1往復していたのだが、新方式では25人乗りの小型バスが4台用意され、行き先が違ったとしても25人ずつを1クロックで届けられる、というわけだ。ビデオメモリの動作速度が最大650MHz相当(325MHzのDDR)に高められたことを、より有効活用できる手法だ。
 ちなみに、GeForce4 MXはコストダウンのためにメモリコントローラが2つしか用意されていないが、RADEON 8500/7500も同様(メモリコントローラは2つ)である。

図1 GeForce4 Ti(NV25)のブロック図(一部編集部の独自予測)
図2 GeForce4 Ti(NV17)のブロック図(一部編集部の独自予測)


表現力をいっそう強化!?
nfiniteFXII

 前ページ図中でもっとも大きなブロックである「nfiniteFXIIエンジン」については、あまり詳しい内容が明らかにされていない。少なくとも発表資料を見る限りでは、各ユニットの個数に追加、変更はなく、コアクロックの高速化などの要因によってパフォーマンスが従来(GeForce3)の1.5倍に引き上げられたようだ。ただ、GeForce3からあまり変更がないと言っても、内部はかなり複雑な仕組みなので解説が必要だろう。

 ポリゴンで構成される3Dオブジェクトは、各頂点データとポリゴンの表面の模様、色彩を管理したテクスチャデータとしてnfiniteFXIIエンジンに読み込まれる。このとき、単純な頂点の移動や陰影の計算だけで済む場合には左側のブロック(頂点バッファと頂点演算プロセッサ、シャドウバッファと光源演算プロセッサ)に流れ、4つのパイプラインを通って同時に最大4つのピクセルとして出力される。

 一方、ポリゴンの内部に頂点を演算合成して、曲面やさざ波などの複雑な表現を行う場合には、右側の「プログラマブルバーテックス(頂点)シェーダ」にデータを読み込ませる。バーテックスシェーダとピクセルシェーダを組み合わせることで、単純なポリゴンから実に複雑な表現が可能になる。ピクセルシェーダは従来のレンダリングユニットがポリゴンやテクスチャ全体に効果を与えるのとは異なり、ピクセル単位で微細に陰影や反射光の効果を指定できる。表情の細かいシワや岩肌のゴツゴツ感も、ピクセルシェーダを使えばよりリアルに再現できる。

 図3、4はDirectX 8.1 SDKに含まれるサンプルを使ったかなり単純な例だが、1枚のフラットなポリゴンに頂点を合成し、頂点座標を上下に移動させることで起伏を起こしてそれに伴う影をつけることで、波紋のような効果を描き出している。これを最初から複雑なポリゴンの集合で描こうとすると、あらかじめ複雑なモデリングを行い、さらに多数のポリゴンデータを短時間に読み込む必要があるが、ビデオチップ内部で合成するこの方法であれば、読み込むデータは極めて少なくて済み、GPU(グラフィックチップ)内部の高速な演算能力を活用できる。

図3、4 DirectX 8.1 SDKに含まれる「Vertex Shader」のデモプログラム。フラットな1枚のポリゴンと、陰影情報テクスチャだけだが、Vertex Shader機能を利用することで波打つように変化する。

図5 Nvidia渾身の3D CGデモの1シーン。発表会場で見た、毛むくじゃらの狼男の体毛が、風になびくシーンは圧巻だった。
 図5は対照的に複雑な例で、Nvidiaが公開しているデモの1シーンだが、毛むくじゃらの狼男の体毛もバーテックスシェーダ&ピクセルシェーダによって表現されている(元の狼男の3Dモデル=約10万ポリゴンには毛の頂点などの座標は含まれず、GPU内部の計算結果に基づいて描画している)。

 なお、GeForce4 Tiはバーテックスシェーダとピクセルシェーダを両方搭載しているが、GeForce4 MXにはピクセルシェーダが搭載されていないため、図5のような複雑な3Dグラフィックスのリアルタイムレンダリングはできない(各種テストプログラムではGeForce4 MXでもバーテックスシェーダの機能が利用できるが、Nvidiaのスペックシートではバーテックスシェーダの記載がないため、図でも省略している)。





描画速度を落とさずに
ジャギーを目立たなくする

 3Dグラフィックスの描画速度(フレームレート)を上げるには、表示解像度を下げて最終的に出力するピクセルデータの量を減らすことも、有効な方法だ。だが解像度を下げるとオブジェクトの輪郭部分にドットのギザギザ(ジャギー)が目立ってしまう場合がある。それを解消するのが「フルスクリーンアンチエイリアス(FSAA)」という機能だ。

 FSAAにはいくつかの方法あるが、GeForce4 Ti&MXで初めて搭載されたのが「Accuview Shifted アンチエイリアシング」という手法だ。

図6 GeForce4のAccuview Shiftedアンチエイリアシング(4XSモード)
 図6に示したのが、従来のFSAAの手法「スーパーサンプリング」、およびGeForce3で搭載された「Quincunxモード」とAccuview Shifted(4XSモード)の違いだ。  スーパーサンプリングでは、描画する解像度の2倍以上の高解像度でピクセルデータをビデオメモリ上の空き領域(バックバッファ)で計算、そのデータから描画したい解像度での色の濃度を算出していく。この方法では、ビデオメモリに十分な空き領域が必要になり、さらにビデオメモリとのデータ転送がボトルネックになってしまう。

 それを解消するためにGeForce3で用意されたのが「HRAA(High Resolution Anti-Aliasing)」とも呼ばれるQuincunxモードだ。これは、描画するのと同じ解像度ながらサンプリングポイントを少しずつずらして5つの点を取り、それぞれの色情報から最適なピクセルデータ(色)を計算するというもの。メモリに余計な負荷をかけず、GPU内部の演算処理だけで済む。つまり、GPUが十分高速であれば描画速度(パフォーマンス)を落とさずにジャギーを目立たなくすることができるハズだ。しかし、実際にGeForce3搭載のビデオカードで試してみたところ、GeForce2 Ultraよりも下落率は小さいものの25%程度の速度低下は免れなかった。また、過去の編集部のテストでは4倍以上のスーパーサンプリングに比べてアンチエイリアスの効果が現れにくい、という結果も出ている。

 より効率的に、かつ効果を高めるためにGeForce4シリーズで初めて採用されたAccview Shifted アンチエイリアスは、Quincunxモードの改良版とも言えるものだ。サンプリングポイントをピクセル内部のずらした2点とし、ピクセルをまたぐ周囲5つのポイントから情報を集めて、1ピクセルに付き2つの合成情報を平均化するというもの。Quincunxに比べてサンプリングポイントの数が減るため、パフォーマンスへの影響を最小限に食い止められるとともに、描画ピクセルに影響するポイントを広げることでより厳密、正確に色情報を算出できるというわけだ。なお、GeForce4には従来のスーパーサンプリング、Quincunxモードも引き続き用意されている。

 ちなみに、GeForce4 MXカードに付属のドライバ(4.17.0024)で確認したところ、Accview ShiftedはDirect3Dアプリでのみ有効になるとのこと。OpenGLアプリでは機能しないので注意してほしい。



マルチモニタユーティリティ
nView

 ここまでは3Dグラフィックスに関する新機能を紹介してきたが、GeForce4Ti&MXには普段のウィンドウ操作を便利にする新機能も搭載されている。それが「nView」だ。

 もう一度1ページ目の図1、2を見てほしい。右上の映像出力部がGeForce3やGeForce2 MXから大きく強化されていることに気が付くだろう。GeForce3は出力が1系統に限定され、GeForce2 MXでは外部RAMDACを用意する(ビデオカード上にRAMDACと外部RGB端子を搭載する)ことで2系統出力が可能になったものの、セカンダリモニタは最大800×600ドット止まりで実用には耐えなかった。

 GeForce4 Ti&MXでは350MHz駆動のRAMDACを2つ内蔵し、RGB端子を2つ持つカードであれば最大2048×1536ドット/フルカラーの2画面表示が可能になるという。残念ながら編集部で評価中のGeForce4カードはRGB端子1つのみなので確認できなかったが(TV出力で最大1024×768ドット/フルカラー表示は可能)、これが使えれば3Dゲームにはあまり興味がないというビジネスユーザーにも大きなメリットになるはずだ。

 さて、nViewの機能には大きく分けて以下の4つがある。

  • 最大9つまで管理できる仮想デスクトップモード
  • 複数画面使用時のウィンドウ&ダイアログボックス管理機能
  • ズーム表示
  • ホットキー管理

 仮想デスクトップは、各種アプリのウィンドウをあらかじめ開いた状態のデスクトップを複数切り替えて使うもので、例えばWord&IEを「デスクトップ1」、Excelの全画面表示を「デスクトップ2」、気分転換にゲームを「デスクトップ3」にそれぞれ開いておき、マウス操作で簡単に切り替えられるというもの。メーラなどすべての画面に見せたいアプリは、全デスクトップに共通で表示させることも可能だ。

 ウィンドウ&ダイアログボックス管理は、複数画面にまたがってウィンドウを大画面(全画面)表示にしたり、ダイアログボックスをプライマリ/セカンダリモニタ(もしくはマウスカーソルのあるモニタ)に表示する、ウィンドウやダイアログボックスをマウスでドラッグ中に半透明化させるなど、使い勝手を向上させる機能だ。

 これらの機能は、「通知領域」(タスクトレイ)のNvidiaアイコンや、各アプリケーションのメニューバーを右クリックしてnViewメニューを呼び出すことで設定するほか、あらかじめ指定したホットキー(ショートカットキー)でウィンドウを出さずに切り替えることも可能だ。

原稿執筆時点では動作が確認できなかったため、『Matroxの「G400/450/550シリーズ」のマルチモニタユーティリティ「DVD Max」のように、DVD再生画面(や動画のオーバーレイ表示領域)のみをTVやセカンダリ画面に出力する、といった機能はない。』と書いておりましたが、その後GeForce4 Ti/MXカードで再度確認したところオーバーレイ領域のセカンダリモニタ出力が可能であることが分かりました。お詫びして訂正いたします。



続々到着! GeForce4 MX搭載
最新ビデオカード

 GeForce4の記者発表会において、PixelView、MSI、Leadtekなどから搭載ビデオカードが同時発表された(残念ながら日本の雄、カノープスの製品発表はなかった)。いずれもビデオチップはGeForce4 MXで、本命であるGeForce4 Tiのほうは3月以降の登場になりそうだが、編集部では以下の4メーカーのGeForce4 MX 440搭載カードを借りられたので、パフォーマンスなどを実機でチェックしていこう。

SPARKLE COMPUTER「SPARKLE SP7100M4」/ビデオチップ GeForce4 MX 440(270MHz)/ビデオメモリ DDR SDRAM 64MB(SAMSUNG製5ns、400MHz相当)/カードサイズ 175×97mm
MSI「GMX460-VT(MS-8863)」/ビデオチップ GeForce4 MX 460(300MHz)/ビデオメモリ DDR SDRAM 64MB(SAMSUNG製3.3ns、550MHz相当)/カードサイズ 175×97mm
Leadtek「WinFast A170 DDR T」/ビデオチップ GeForce4 MX 440(270MHz)/ビデオメモリ DDR SDRAM 64MB(SAMSUNG製4ns、400MHz相当)/カードサイズ 165×97mm
Abit「Siluro GF4 MX」/ビデオチップ GeForce4 MX 440(270MHz)/ビデオメモリ DDR SDRAM 64MB(SAMSUNG製4ns、400MHz相当)/カードサイズ 165×87mm

テスト環境(自作PC)

  • CPU PentiumIII-800EBMHz
  • マザーボード AOPen AX3SP Pro-U
  • メモリ SDRAM 256MB
  • HDD 40GB(UltraATA/100)+20GB(UltraATA/66)
  • OS Windows XP Professional(英語版)
  • ドライバ 6.13.10.2720(GeForce4)、6.13.10.2311(DetonatorXP 23.11、GeForce3 Ti 500/2 MX 400)
  • ベンチマークテスト 3DMark 2001 SE、QuakeIII DEMO(DEMO001)

 ベンチマークテストに英語版のWindows XPを使用した理由は、GeForce4 MXカードに付属のドライバでは日本語版のXP上でベンチマークテスト(3DMark 2001および同 SE)が正常に動作しなかったためだ。そのため、日本語版XP上でのパフォーマンスとは異なる可能性もあるので、参考値として見てほしい。

3DMark 2001 SEの結果 1024×768ドット/フルカラー
 3DMark 2001 SEの結果(グラフ1)では、GeForce3 Ti 500に20%以上の差をつけられているように見えるが、実はGeForce4 MXではスキップされたテスト(ピクセルシェーダを利用するGame4など)が含まれているため、トータルスコアが伸びなかっただけで、個別の数値(Game1/2/3のフレームレート)はGeForce4 MX 440でもほぼ互角、460では上回る場合もある。ピクセルシェーダを使わない一般的なゲームであればGeForce3並みのパフォーマンスが期待できる。



図7 FSAAの効果は3DMark 2001 SEのサンプル画面でも実感できる。一番左のAccuview Shiftedモードはスーパーサンプリングで一番精細な4xモードに相当し、2x相当のQuincunxモードとは一目で違いが分かる。特にサングラスや肩の稜線に注目。
 新機能のAccuview Shiftedアンチエイリアスは、意外にスコアに大きく影響するようで、FSAAなしに比べて半分程度まで落ちてしまった。ただ、Game1/2/3のフレームレートでは10fps程度の下落にとどまり、従来のQuincunxモードよりも確実にアンチエイリアスの効果が視認できた(図7)。



Quake3 Demo(DEMO001)でのテスト結果 1600×1200ドット/フルカラー
 一方、OpenGL対応3Dゲームの代表であるQuakeIIIの結果(グラフ2)は、1024×768ドット/フルカラーモードではほとんど差が付かず(GeForce2 MXを除く)、より高解像度の1600×1200ドット/フルカラーで20〜30%程度の差がついたものの、それでも60fpsを超える好結果を出した。

 GeForce4 MXカードに関して言えば、実売1万円台半ばでGeForce3並みの高速3D描画を得られる、極めてコストパフォーマンスの高い製品だと言える。GeForce2 MXやそれ以前のビデオカードを使い続けているなら、乗り換えを検討する価値は大いにある。



(アスキーPC Explorer編集部・佐久間 康仁)




[通常ページに戻る]
ASCII24 http://ascii24.com/
Copyright (C)2000-2008 ASCII Corporation. All rights reserved.