【レビュー】 Khadas VIM4 with NPU:NPU内蔵で用途によっては便利になったけど、その用途が限られているSBC

レビュー

がじぇっとりっぷでは以前に「VIM4」というSBC(シングルボードコンピューター)をレビューしています。

【レビュー】Khadas VIM4:ちょっと高いけどほぼ文句なしのハイパフォーマンスSBC

「VIM4」にはAI用のNPU(ニューラルプロセッシングユニット)が組み込まれていないAmlogic A311D2が搭載されていますが、Khadasではバリエーションモデルとして3.2TOPSのNPUを内蔵したA311D2-N0Dモデル(以下「VIM4 NPU」)を発売しました。
今回はその、NPU内蔵バージョンのレビューとなります。

機材を提供いただいたKhadas様にはこの場をお借りして御礼申し上げます。

スポンサーリンク

Khadas VIM4 with NPU

CPUAmlogic A311D2-N0D
メモリ8GB LPDDR4X-2016
ストレージ32GB eMMC
インターフェースUSB Type-C(2.0)×1
USB 3.0×1
USB 2.0×1
HDMI
HDMI-IN
1GbE 有線LAN
microSDXC
wi-fi802.11ax+BT5.1
サイズ82×58×11.5mm

GoodPoint
NPUが追加されて用途が広がる
NPU抜きにしてもかなりの高性能
OOWOWが超便利

BadPoint
NPUが結構使いにくい
USBが2.0も3.0も黒で見分けがつかない

技適番号は箱の裏面に記載されています。
通信周りは「VIM4」と変わらないため、技適番号も「VIM4」と共通です。

参考 技術基準適合証明等を受けた機器の検索(219-229035):総務省

ボードについて

インターフェースはUSB3.0とUSB2.0が混在していますが、色分けされておらず(どちらも端子内が黒)、見た目が同じなので、USBを接続するときにちょっと悩みます。

サイズ感は手のひらサイズ。
82×58mmなので、ラズパイ(85×56mm)と同じ程度です。

ベンチマーク

Android

ストレージベンチ

ストレージ速度は#1が内部eMMC、#2がmicroSDです。
microSDはSanDiskのExtreme Pro(128GB、実測でリード170MB/s・ライト113MB/s)を使用しています。

内部eMMCはリード113MB/s、ライト54MB/sでした。eMMCなのでこんなものですね。
microSDは意外と早くて、リード68MB/s、ライト24MB/sでした。これならギリギリ、ストレージとしても運用できそうです。

AnTuTu

CPUAnTuTu (v9)
Xiaomi Pad 5581218150489
Edge2552582130750
iPlay 50 Pro359132103082
VIM428043064514
VIM4 NPU26588060255
P40HD23467762146
NanoPC-T415121450689
VIM1S8877020326

上段:総合、下段:CPUスコア

AnTuTuはv9とv10で計測。

比較データの多いAnTuTu(v9)では、総合26.5万点、グラフィック8.3万点でした。
だいたい、CPUスコアはUNISOC T606程度、グラフィックスコアはHelio G99にちょっと及ばない程度となり、スマホ・タブレットでいえばエントリー上位~ミドル下位程度の性能ということになります。

GeekBench

GeekBenchはv5とv6をテスト。
v5のマルチスレッドスコアはCeleron N5100を上回り、Ryzen 3 3200UやCeleron J4125と同程度となります。

AITuTu

AITuTuはAnTuTuが出しているAIベンチマークです。

ようやく、「VIM4」と差が出ました(スコアは下記一覧表参照)。
AITuTuでは「画像分類」「物体検出」「超解像化」の3つのテストを行い、その合計値をスコアとしています。
NPUのない「VIM4」では「画像分類」と「超解像化」がエラー、唯一パスした「物体検出」でも「VIM4 NPU」の半分以下のスコアと、NPUの有無の差がはっきりとわかる結果となりました。

BurnOut

AI系ベンチマークは他にBurnOutとAI-Benchmarkの2種類を検証。
CPU・GPU・NPUの総合テストであるBurnOutは、それぞれの使用率グラフが付いていて、NPUも使われているってのが分かりやすいのですが、「VIM4」ではNPUテストでこけて完走できませんでした。

AI-Benchmarkではスコアが「VIM4」比約1.5倍と優位に差が付きました(下記の表参照)。

その他

行ったベンチマーク一覧です。
比較対象として「VIM4」「VIM1S」「Edge2」のほか、UNISOC T606搭載のTeclast「P40HD」およびHelio G99搭載のAlldocube「iPlay 50 Pro」を入れています。

【レビュー】 Khadas VIM1S:マルチなサーバーとして使える、ファンレス動作余裕な1万円切りのSBC
【レビュー】Teclast P40HD:高速ストレージにFHD画質で動画も見れる、そこそこスペックな良コスパタブレット
【レビュー】 Alldocube iPlay50 Pro:Helio G99搭載の(ゲーム向けでは)2万円台最強タブレット
メーカーKhadasKhadasKhadasKhadasTeclastAlldocube
モデル名VIM4 NPUVIM4Edge2VIM1SP40HDiPlay50 Pro
CPUA311D2-N0DA311D2RK3588SS905Y4Unisoc T606Helio G99
メモリ8GB8GB8GB2GB6GB8GB
ストレージ32GB eMMC32GB eMMC32GB eMMC16GB eMMC128GB UFS256GB UFS
OSAndroid 11Android 11Android 12Android 11Android 12Android 12
AnTuTu (v9)総合26588028043055258288770234677359132
CPU60255645141307502032662146103082
GPU832808526523722995963513085789
MEM453425015361646274747272073038
UX7700380498122957313746468197223
AnTuTu (v10)総合301419292159568757動作不可267365416037
CPU8870488207173856動作不可82221138802
GPU6184562469164869動作不可2841679883
MEM742986700797107動作不可9986697627
UX7657274476132925動作不可5686299725
GeekBench 5シングル330338613115308548
マルチ15431565205238313261835
Compute2105209343933815171544
GeekBench 6シングル367367818非対応367724
マルチ146014492349非対応13602015
Compute187119303549非対応4481295
GeekBench MLCPU159161270非対応163263
GPU147147777非対応193470
NPU55242非対応111完走できず
3DMarkWild Life1074112641824161246
Wild Life Unlimited113841254141231
Wild Life EX3053101116114344
Sling Shot25102820647459414173522
Sling Shot Unlimited2865704958615013780
Sling Shot EX1949207854909522593
IceStormMaxed outMaxed outMaxed outMaxed outMaxed outMaxed out
IceStorm EXMaxed outMaxed outMaxed out10084Maxed outMaxed out
IceStorm Unlimited280466476859941648832695
PassMarkSystem487048199601151262869766
CPU37473719477466929774744
Memory15270146481617837381206516196
Disk202302251627313118096812557356
2D138991380428996102671447923207
3D40626405123072579551058521681
ブラウザjetstream237.12245.46681.20917.82340.95968.892
BaseMark213.67125.23394.2394.27215.73290.9
WebXPRT3636797366898
WebXPRT4414465214472
MotionMark63.12107.51695.4730.3151.8132.37
Octane1138497882506142301112622248
Speedometer27.9520.280.613.8432.5942.6
PCMarkWork 3.0643172579422421272498875
Battery (100%)4h29m7h48m
Battery (50%)7h48m15h55m
Burnout13.3完走不可24.617.812.7
AI-Benchmark33.423.596.7動作不可38.170.5
AiTuTu総合2116803169579593490746716780165
Image72177033027247752830330230
Object724753169541083240643641033053
SR6702805483535244916882

AI向けのGeekBench MLでの値がやたら低いのが気になります。

中を見るとint8(8bit整数)の計算だけができていて、FP32およびFP16(32bitおよび16bit浮動小数)での計算ができていません。
というかこれ、「VIM4」と同じスコアなので、NNAPI(Android Neural Networks API)を叩いているのに、NPUではなくてCPUで計算していますね

Linux

Linuxではタブレットのベンチマークはないので、代わりにOKdo「Nano C100」(Jetson Nano互換品)を比較対象に追加しています。

【レビュー】 OKdo Nano C100 開発キット:もうひとひねり欲しい、Jetson Nano B01の互換キット

UnixBench

Linux系はまず定番のUnixBenchから。

$ git clone https://github.com/kdlucas/byte-unixbench
$ cd byte-unixbench/UnixBench
$ ./Run
CPUUNIX Bench
Edge25079.91040.9
Orange Pi 54886904.9
VIM43099.2547.8
VIM4 NPU3078541.2
NanoPC-T41299.1392.6
Nano C100 (10W)1262.7342.6
VIM1S1146367.4
Raspverry Pi 41094.6369.3
Nano C100 (5W)429.3245

上段:マルチスレッド、下段:シングルスレッド

UnixBenchでは、まあまあのところに付けています。
「Raspverry Pi 4」の2.8倍って、考えてみたら結構強力ですね。

GeekBench

WindowsではおなじみのGeekBenchには、実はARM/RISC-V向けのベータ版が存在します。
ただし、実行はCUIで行い、結果は提示されたURLを見に行くスタイルです

Preview Versions - Geekbench
// GeekBench 5
$ wget https://cdn.geekbench.com/Geekbench-5.5.1-LinuxARMPreview.tar.gz
$ tar -zxvf Geekbench-5.5.1-LinuxARMPreview.tar.gz
$ cd Geekbench-5.5.1-LinuxARMPreview/
$ ./geekbench5

// GeekBench 6
$ wget https://cdn.geekbench.com/Geekbench-6.1.0-LinuxARMPreview.tar.gz
$ tar -zxvf Geekbench-6.1.0-LinuxARMPreview.tar.gz
$ cd Geekbench-6.1.0-LinuxARMPreview/
$ ./geekbench6
CPUGeekBench5
Edge22657653
Orange Pi 52627655
VIM41653352
VIM4 NPU1501351
Nano C100 (10W)831231
NanoPC-T4731248
Raspverry Pi 4666230
VIM1S450138
Nano C100 (5W)296154

上段:マルチスレッド、下段:シングルスレッド

GeekBench5のスコアだとRaspverry Pi 4の2.25倍程度。UnixBenchより差が小さくなっていますが、依然として強力であることに変わりはありません。

「VIM4」とは微妙に差があるのですが、個体差でしょうか?

PassMark

PassMarkもARM版が存在します。
32bit版と64bit版があり、「VIM4 NPU」は64bit版を使います。

Download PassMark PerformanceTest - PC Benchmark Software
Benchmark the speed of your PC computer hardware, then compare the result to other machines. Includes disk, 3D and CPU tests.
// 足りないライブラリを追加しておく
$ sudo apt install libncurses5

$ wget https://www.passmark.com/downloads/pt_linux_arm64.zip
$ unzip pt_linux_arm64.zip
$ cd PerformanceTest/
$ ./pt_linux_arm64
CPUPassMark
Orange Pi 531851503
Edge231101224
VIM419031040
VIM4 NPU18891039
NanoPC-T41112639
Nano C100 (10W)987589
VIM1S549439
Raspverry Pi 4512596
Nano C100 (5W)327485

上段:CPU、下段:メモリ

PassMarkは「VIM4」と誤差程度に。まぁNPU以外は同じですし…

glmark2

GLMark2はLinux系では定番のグラフィックベンチマークの一つで、名前の通りOpenGL 2.0を使用して計測します。
OpenGL ES2.0を使うバージョン(glmark2-es2)もあるのですが、スコアがかけ離れるため、glmark2で統一したので比較データが少ないです。

$ sudo apt install glmark2
$ glmark2
CPUglmark2
Edge2175
VIM4130
VIM4 NPU129
VIM1S44

上段:CPU、下段:メモリ

MNIST

MNISTは機械学習系のベンチマークです。
正確にはベンチマークではないのですが、実行時間をベンチマークとして利用できます。
MNISTは手書き数字画像60,000枚と、テスト画像10,000枚を集めた画像データセットのことで、機械学習入門としてよく使われます。

ただし、CUDA系のベンチマークなので、NPUは使われないようです。

// Tensorflowのインストール
$ sudo apt update // updateしておかないとエラーが出る
$ sudo apt install python3-pip // SBCはpipが入っていないことが多い
$ pip3 install tensorflow

// MNISTの実行サンプルをダウンロード
$ git clone https://github.com/tak6uch1/cuda-tensorflow
$ cd cuda-tensorflow/work

// 実行
$ time python3 mnist_cnn.py
realusersys
VIM4 NPU30m1.411s190m28.593s5m46.950s
VIM429m32.821s185m41.339s4m49.974s
Edge216m37.055s102m20.492s3m43.342s
VIM1S133m10.630s486m33.339s4m0.410s

timeコマンドは以下のように見ます。

real:実際にかかった時間
user:プログラムの処理時間(各CPUコアの積算)
sys:プログラムに絡んでプログラム以外にCPUを浸かった時間

かかった時間は「VIM4」とほぼ同じ。
つまり、MNISTはNPUを使わず、CPUで計算処理が行われていたことを意味します。
まぁそもそも、CUDAコアを搭載したGPU向けのベンチなので…

AI-Benchmark

AI-BenchmarkはMobileNet-V2やInception-V4、DeepLabなど主要なモデルを網羅したベンチマークで、19セクション、42テストを行います。
各セクションの処理時間がベンチマークとして使用できます。
どうも20分程度でタイムアウトするようで、途中までしか計測できません。

// Tensorflowのインストールは省略(上を参照)
// 1.24以降だとエラーが出るので、numpyをバージョンダウンしておく
$ pip uninstall numpy
$ pip install numpy==1.23.1

$ pip install ai-benchmark
$ python3 -c "from ai_benchmark import AIBenchmark; results = AIBenchmark().run()"
CPUAI-Benchmark(←Better)
Edge21293ms2893ms
VIM4 NPU2184ms5520ms
VIM421145597ms
VIM1S7540timeout

上段:MobileNet-V2、下段:Inseption-V3

ここで「VIM4」と差が付くと思っていたのに、結果は誤差程度に。
CPUを使わないオプションを付けて AIBenchmark(use_CPU=None) としても結果は変わらなかったので、どうもCPU・NPUは使わずGPUで計算している模様

あれこれベンチマークを探したのですが、現状ではLinuxで手軽にNPUの差を見ることはできなさそうです。

外観

外箱です。

パッケージ一覧。
中身はマニュアルとカード(ドキュメントのURLが書かれているだけ)、アンテナとシンプル。

サイズ感はiPhone8どころか、iPhone4よりも小さいサイズ。

表側全体。

裏側です。

インターフェース。

反対のGPIOピン側。
左に見えるのはHDMI-INで、HDMI-INとGPIOピンの間にマイクがあります。

ボタンは3つ。左からP(Power)、F(Function)、R(Reset)です。

Wi-fiアンテナ差込口。
AとBと書かれていて、アンテナ側と対応しているので、きちんと確認していれば間違えることはないでしょう。

ファン付きヒートシンクを外したところ。

SoCには「A311D2-N0D」の文字。

下2つのメモリはSKHynix製、右のストレージ(eMMC)はSamsung製でした。

Wi-fiはAP6275S、有線LANチップ(GbE)はRealtek 8211FD、パルストランスにH5120NLを実装しています。

拡張ボード

当たり前の話ですが、「VIM4 NPU」では「VIM4」用の拡張ボードが使えます

拡張ボードを装着し、M.2 SSDを付けたところ。

created by Rinker
Khadas
¥1,380(2024/07/18 22:49:29時点 Amazon調べ-詳細)

他モデルと比較

「VIM1S」と「VIM4」と並べたところ。
サイズは全く同じです。

インターフェース配置は共通で、入れ替えが容易です。

SoCしか違わない「VIM4」とはそっくりで、見分けるポイントはバージョン番号と、裏面のQRコードシールに書かれた「NPU」の文字くらいという。

OOWOW

「VIM4 NPU」はKhadas独自の「OOWOW」という管理ツールに対応しています。
マニュアルにも書かれていますが、「OOWOW」は”F”ボタンを押しながら”R”でリセットすると、5秒程度で起動します。

ネットワークにつないだら、OSを選択するだけのお手軽インストール。
気軽にOSを変更できますし、非常に便利です。

それにしても、バージョン違い含めて選択肢がだいぶ増えたなぁ…

Android

Androidは最新バージョンがなぜか起動しなかったので、ひとつ前のバージョンをインストール。

Khadas独自の項目「Khadas Setting」があり、画面の回転(アプリによっては強制的に戻される)やファンの回転制御、HDMI-INなどスマホでは存在しないような項目がまとめられています。

Ubuntu

Ubuntuは最新版で特に問題なくインストール完了。
AndroidもですがOOWOWとはWI-fiの管理が別なので、改めて接続する必要があります。

SSHでつないだらこう。
機種ごとに作りこまれています。

まとめ

「VIM4 NPU」の価格は、冷却ユニット込みで32,800円
NPUなしの「VIM4(冷却ユニット)」(29,800円)とは3,000円差です。

NPUの活用方法としてはやはり画像認識・音声認識が主流で、自動運転における物体(車・人・看板etc)認識や、工場のラインにおける不良品検知など、使いどころは広がっています。
とはいえパイは大きいとは言えないので、全部NPU付きにすべきと言えないのがなかなかに難しいところ。
今のところ世の中の大半の処理はNPUを必要としていないですしね。

「VIM4 NPU」の3.2TOPSより強力な6.0TOPSのNPUを内蔵する「Edge2」とは価格が近い(ヒートシンクと合わせて37,380円)ものの、ベンチマークを見る限りでは得意・不得意が違う感じなので、うまく住み分けができるんじゃないかなぁと。
まぁ、「Edge2」はパワフルなCPUによるごり押しができるんですけど。

ハマれば強いものの、そのハマりどころを探すのが大変。「VIM4 NPU」はそんな感じの一台と言えそうです。

関連リンク

付録:上で掲載しなかったベンチマーク結果画像

付録:ベンチマーク生データ

========================================================================
   BYTE UNIX Benchmarks (Version 5.1.3)

   System: Khadas: GNU/Linux
   OS: GNU/Linux -- 5.4.180 -- #1.5 SMP PREEMPT Tue Apr 25 12:26:22 UTC 2023
   Machine: aarch64 (aarch64)
   Language: en_US.utf8 (charmap="UTF-8", collate="UTF-8")
   CPU 0:  (48.0 bogomips)

   CPU 1:  (48.0 bogomips)

   CPU 2:  (48.0 bogomips)

   CPU 3:  (48.0 bogomips)

   CPU 4:  (48.0 bogomips)

   CPU 5:  (48.0 bogomips)

   CPU 6:  (48.0 bogomips)

   CPU 7:  (48.0 bogomips)

   17:09:56 up  1:10,  2 users,  load average: 10.18, 28.64, 19.48; runlevel 2023-08-16

------------------------------------------------------------------------
Benchmark Run: Wed Aug 16 2023 17:09:56 - 17:38:05
8 CPUs in system; running 1 parallel copy of tests

Dhrystone 2 using register variables       20031313.2 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     3780.8 MWIPS (10.0 s, 7 samples)
Execl Throughput                               1623.9 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks        176443.2 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           49708.9 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        510762.0 KBps  (30.0 s, 2 samples)
Pipe Throughput                              294818.5 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                  63829.9 lps   (10.0 s, 7 samples)
Process Creation                               4209.6 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   4700.1 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   2420.4 lpm   (60.0 s, 2 samples)
System Call Overhead                         319243.0 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   20031313.2   1716.5
Double-Precision Whetstone                       55.0       3780.8    687.4
Execl Throughput                                 43.0       1623.9    377.7
File Copy 1024 bufsize 2000 maxblocks          3960.0     176443.2    445.6
File Copy 256 bufsize 500 maxblocks            1655.0      49708.9    300.4
File Copy 4096 bufsize 8000 maxblocks          5800.0     510762.0    880.6
Pipe Throughput                               12440.0     294818.5    237.0
Pipe-based Context Switching                   4000.0      63829.9    159.6
Process Creation                                126.0       4209.6    334.1
Shell Scripts (1 concurrent)                     42.4       4700.1   1108.5
Shell Scripts (8 concurrent)                      6.0       2420.4   4033.9
System Call Overhead                          15000.0     319243.0    212.8
                                                                   ========
System Benchmarks Index Score                                         541.2

------------------------------------------------------------------------
Benchmark Run: Wed Aug 16 2023 17:38:05 - 18:06:22
8 CPUs in system; running 8 parallel copies of tests

Dhrystone 2 using register variables      124476257.1 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                    26268.9 MWIPS (9.9 s, 7 samples)
Execl Throughput                               9019.5 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks       1250804.0 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks          352346.0 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks       3432632.1 KBps  (30.0 s, 2 samples)
Pipe Throughput                             2552640.4 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 419653.2 lps   (10.0 s, 7 samples)
Process Creation                              20634.6 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                  19320.4 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   2679.7 lpm   (60.1 s, 2 samples)
System Call Overhead                        3555195.8 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0  124476257.1  10666.3
Double-Precision Whetstone                       55.0      26268.9   4776.2
Execl Throughput                                 43.0       9019.5   2097.5
File Copy 1024 bufsize 2000 maxblocks          3960.0    1250804.0   3158.6
File Copy 256 bufsize 500 maxblocks            1655.0     352346.0   2129.0
File Copy 4096 bufsize 8000 maxblocks          5800.0    3432632.1   5918.3
Pipe Throughput                               12440.0    2552640.4   2052.0
Pipe-based Context Switching                   4000.0     419653.2   1049.1
Process Creation                                126.0      20634.6   1637.7
Shell Scripts (1 concurrent)                     42.4      19320.4   4556.7
Shell Scripts (8 concurrent)                      6.0       2679.7   4466.1
System Call Overhead                          15000.0    3555195.8   2370.1
                                                                   ========
System Benchmarks Index Score                                        3078.0
                          PassMark PerformanceTest Linux

Khadas VIM4
Cortex-A53 (aarch64)
4 cores @ 2208 MHz  |  7.6 GiB RAM
Number of Processes: 8  |  Test Iterations: 1  |  Test Duration: Medium
--------------------------------------------------------------------------
CPU Mark:                          1889
  Integer Math                     26885 Million Operations/s
  Floating Point Math              6907 Million Operations/s
  Prime Numbers                    8.6 Million Primes/s
  Sorting                          10090 Thousand Strings/s
  Encryption                       393 MB/s
  Compression                      16855 KB/s
  CPU Single Threaded              581 Million Operations/s
  Physics                          214 Frames/s
  Extended Instructions (NEON)     1079 Million Matrices/s

Memory Mark:                       1039
  Database Operations              1255 Thousand Operations/s
  Memory Read Cached               6565 MB/s
  Memory Read Uncached             6286 MB/s
  Memory Write                     6721 MB/s
  Available RAM                    4805 Megabytes
  Memory Latency                   95 Nanoseconds
  Memory Threaded                  13987 MB/s
--------------------------------------------------------------------------

Results not submitted
Upload results to cpubenchmark.net? [Y/n]:

Use ESC or CTRL-C to exit
A: Run All Tests   C: Run CPU Tests   M: Run Memory Tests   U: Upload Test Results
=======================================================
    glmark2 2021.02
=======================================================
    OpenGL Information
    GL_VENDOR:     Mesa/X.org
    GL_RENDERER:   llvmpipe (LLVM 15.0.6, 128 bits)
    GL_VERSION:    4.5 (Compatibility Profile) Mesa 22.2.5
=======================================================
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#mb2371b8]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#vc6b9d86]
[build] use-vbo=false: FPS: 159 FrameTime: 6.289 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#db262bef]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#o6c6e06b]
[build] use-vbo=true: FPS: 160 FrameTime: 6.250 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#m236c794]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#kd1d0286]
[texture] texture-filter=nearest: FPS: 295 FrameTime: 3.390 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#g89619f6]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#b873484a]
[texture] texture-filter=linear: FPS: 275 FrameTime: 3.636 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#m9098117]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#af6e536e]
[texture] texture-filter=mipmap: FPS: 224 FrameTime: 4.464 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#c4b2125a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#yecb3af0]
[shading] shading=gouraud: FPS: 111 FrameTime: 9.009 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#x16ebf76]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#d019327d]
[shading] shading=blinn-phong-inf: FPS: 104 FrameTime: 9.615 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#o82247f1]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#kd1c5c20]
[shading] shading=phong: FPS: 90 FrameTime: 11.111 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#m7c059c6]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#m0975cd0]
[shading] shading=cel: FPS: 93 FrameTime: 10.753 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#s214d075]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#d4399ce5]
[bump] bump-render=high-poly: FPS: 46 FrameTime: 21.739 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#acfe3345]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#k16c221c]
[bump] bump-render=normals: FPS: 259 FrameTime: 3.861 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#e36f88a1]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#z21a1e99]
[bump] bump-render=height: FPS: 227 FrameTime: 4.405 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#t2a1479a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#j0b63854]
[effect2d] kernel=0,1,0;1,-4,1;0,1,0;: FPS: 137 FrameTime: 7.299 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#kbab73ef]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#h4caede1]
[effect2d] kernel=1,1,1,1,1;1,1,1,1,1;1,1,1,1,1;: FPS: 120 FrameTime: 8.333 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#qa896a83]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#fc6bec1c]
[pulsar] light=false:quads=5:texture=false: FPS: 228 FrameTime: 4.386 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#i878a218]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#t0455079]
[desktop] blur-radius=5:effect=blur:passes=1:separable=true:windows=4: FPS: 41 FrameTime: 24.390 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#x3c341dd]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#mabddbfd]
[desktop] effect=shadow:windows=4: FPS: 87 FrameTime: 11.494 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#lc59f826]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#xbb91478]
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 75 FrameTime: 13.333 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#n50a4c4c]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#uf68f947]
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=subdata: FPS: 76 FrameTime: 13.158 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#s9746710]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#l4856738]
[buffer] columns=200:interleave=true:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 80 FrameTime: 12.500 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#he0136ad]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#rb13d6f4]
[ideas] speed=duration: FPS: 93 FrameTime: 10.753 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#e2f78163]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#v5f3b6c9]
[jellyfish] : FPS: 59 FrameTime: 16.949 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#dd1e7d79]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#z5d606de]
[terrain] : FPS: 3 FrameTime: 333.333 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#cb034a44]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#jcbc9c33]
[shadow] : FPS: 77 FrameTime: 12.987 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#qc5b8578]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#za054529]
[refract] : FPS: 9 FrameTime: 111.111 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#mab72f5a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#xdd161dc]
[conditionals] fragment-steps=0:vertex-steps=0: FPS: 152 FrameTime: 6.579 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#n61d087a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#m6c80964]
[conditionals] fragment-steps=5:vertex-steps=0: FPS: 143 FrameTime: 6.993 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#c85c4c5f]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#x5be02c5]
[conditionals] fragment-steps=0:vertex-steps=5: FPS: 153 FrameTime: 6.536 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#r972042f]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#ld1d8364]
[function] fragment-complexity=low:fragment-steps=5: FPS: 146 FrameTime: 6.849 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#p5e8a61a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#ec115ef1]
[function] fragment-complexity=medium:fragment-steps=5: FPS: 132 FrameTime: 7.576 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#z41830a1]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#y139cade]
[loop] fragment-loop=false:fragment-steps=5:vertex-steps=5: FPS: 144 FrameTime: 6.944 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#x9e85eb0]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#t9c7baa2]
[loop] fragment-steps=5:fragment-uniform=false:vertex-steps=5: FPS: 143 FrameTime: 6.993 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#g5474a6f]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#icf08d6c]
[loop] fragment-steps=5:fragment-uniform=true:vertex-steps=5: FPS: 135 FrameTime: 7.407 ms
=======================================================
                                  glmark2 Score: 129 
=======================================================
>>   AI-Benchmark-v.0.1.2
>>   Let the AI Games begin..

*  TF Version: 2.13.0
*  Platform: Linux-5.4.180-aarch64-with-glibc2.35
*  CPU: N/A
*  CPU RAM: 8 GB

The benchmark is running...
The tests might take up to 20 minutes
Please don't interrupt the script

1/19. MobileNet-V2

1.1 - inference | batch=50, size=224x224: 2184 ± 68 ms
1.2 - training  | batch=50, size=224x224: 6920 ± 76 ms

2/19. Inception-V3

2.1 - inference | batch=20, size=346x346: 5520 ± 35 ms
2.2 - training  | batch=20, size=346x346: 20830 ± 21 ms

3/19. Inception-V4

3.1 - inference | batch=10, size=346x346: 5516 ± 10 ms
3.2 - training  | batch=10, size=346x346: 20162 ± 40 ms

4/19. Inception-ResNet-V2

4.1 - inference | batch=10, size=346x346: 6490 ± 11 ms
4.2 - training  | batch=8, size=346x346: 19052 ± 35 ms

5/19. ResNet-V2-50

5.1 - inference | batch=10, size=346x346: 3586 ± 29 ms
5.2 - training  | batch=10, size=346x346: 12498 ± 100 ms

6/19. ResNet-V2-152

6.1 - inference | batch=10, size=256x256: 5708 ± 20 ms
6.2 - training  | batch=10, size=256x256: 21572 ± 113 ms

コメント

タイトルとURLをコピーしました