【レビュー】 Khadas VIM4 with NPU:NPU内蔵で用途によっては便利になったけど、その用途が限られているSBC

レビュー

がじぇっとりっぷでは以前に「VIM4」というSBC(シングルボードコンピューター)をレビューしています。

【レビュー】Khadas VIM4:ちょっと高いけどほぼ文句なしのハイパフォーマンスSBC
日本はSBC市場が小さく、技適を取得するSBCは「Raspberry Pi」シリーズやASUS「Tinker Board」シリーズなど一部の製品にとどまっています。そんな日本のSBC事情の中、Khadas「VIM4」は発売前から技適を取得し

「VIM4」にはAI用のNPU(ニューラルプロセッシングユニット)が組み込まれていないAmlogic A311D2が搭載されていますが、Khadasではバリエーションモデルとして3.2TOPSのNPUを内蔵したA311D2-N0Dモデル(以下「VIM4 NPU」)を発売しました。
今回はその、NPU内蔵バージョンのレビューとなります。

機材を提供いただいたKhadas様にはこの場をお借りして御礼申し上げます。

スポンサーリンク

Khadas VIM4 with NPU

CPU Amlogic A311D2-N0D
メモリ 8GB LPDDR4X-2016
ストレージ 32GB eMMC
インターフェース USB Type-C(2.0)×1
USB 3.0×1
USB 2.0×1
HDMI
HDMI-IN
1GbE 有線LAN
microSDXC
wi-fi 802.11ax+BT5.1
サイズ 82×58×11.5mm

GoodPoint
NPUが追加されて用途が広がる
NPU抜きにしてもかなりの高性能
OOWOWが超便利

BadPoint
NPUが結構使いにくい
USBが2.0も3.0も黒で見分けがつかない

技適番号は箱の裏面に記載されています。
通信周りは「VIM4」と変わらないため、技適番号も「VIM4」と共通です。

参考 技術基準適合証明等を受けた機器の検索(219-229035):総務省

ボードについて

インターフェースはUSB3.0とUSB2.0が混在していますが、色分けされておらず(どちらも端子内が黒)、見た目が同じなので、USBを接続するときにちょっと悩みます。

サイズ感は手のひらサイズ。
82×58mmなので、ラズパイ(85×56mm)と同じ程度です。

ベンチマーク

Android

ストレージベンチ

ストレージ速度は#1が内部eMMC、#2がmicroSDです。
microSDはSanDiskのExtreme Pro(128GB、実測でリード170MB/s・ライト113MB/s)を使用しています。

内部eMMCはリード113MB/s、ライト54MB/sでした。eMMCなのでこんなものですね。
microSDは意外と早くて、リード68MB/s、ライト24MB/sでした。これならギリギリ、ストレージとしても運用できそうです。

AnTuTu

CPU AnTuTu (v9)
Xiaomi Pad 5 581218150489
Edge2 552582130750
iPlay 50 Pro 359132103082
VIM4 28043064514
VIM4 NPU 26588060255
P40HD 23467762146
NanoPC-T4 15121450689
VIM1S 8877020326

上段:総合、下段:CPUスコア

AnTuTuはv9とv10で計測。

比較データの多いAnTuTu(v9)では、総合26.5万点、グラフィック8.3万点でした。
だいたい、CPUスコアはUNISOC T606程度、グラフィックスコアはHelio G99にちょっと及ばない程度となり、スマホ・タブレットでいえばエントリー上位~ミドル下位程度の性能ということになります。

GeekBench

GeekBenchはv5とv6をテスト。
v5のマルチスレッドスコアはCeleron N5100を上回り、Ryzen 3 3200UやCeleron J4125と同程度となります。

AITuTu

AITuTuはAnTuTuが出しているAIベンチマークです。

ようやく、「VIM4」と差が出ました(スコアは下記一覧表参照)。
AITuTuでは「画像分類」「物体検出」「超解像化」の3つのテストを行い、その合計値をスコアとしています。
NPUのない「VIM4」では「画像分類」と「超解像化」がエラー、唯一パスした「物体検出」でも「VIM4 NPU」の半分以下のスコアと、NPUの有無の差がはっきりとわかる結果となりました。

BurnOut

AI系ベンチマークは他にBurnOutとAI-Benchmarkの2種類を検証。
CPU・GPU・NPUの総合テストであるBurnOutは、それぞれの使用率グラフが付いていて、NPUも使われているってのが分かりやすいのですが、「VIM4」ではNPUテストでこけて完走できませんでした。

AI-Benchmarkではスコアが「VIM4」比約1.5倍と優位に差が付きました(下記の表参照)。

その他

行ったベンチマーク一覧です。
比較対象として「VIM4」「VIM1S」「Edge2」のほか、UNISOC T606搭載のTeclast「P40HD」およびHelio G99搭載のAlldocube「iPlay 50 Pro」を入れています。

【レビュー】 Khadas VIM1S:マルチなサーバーとして使える、ファンレス動作余裕な1万円切りのSBC
SBC(シングルボードコンピュータ)の分野において、日本での入手性は決して良いとは言えません。大半はAliExpressやメーカー公式サイト、あるいはかなり割高な代理店から購入せざるを得ないのが現状です。そんな中、きっちり技適も取得し、Am
【レビュー】Teclast P40HD:高速ストレージにFHD画質で動画も見れる、そこそこスペックな良コスパタブレット
2022年12月06日、TeclastはUnisoc T606を搭載したタブレット「P40HD」を発売しました。この「P40HD」、「P30HD」のSC9863Aから大幅な性能アップでしたが、発売当時はメモリ4GB、ストレージは64GB e
【レビュー】 Alldocube iPlay50 Pro:Helio G99搭載の(ゲーム向けでは)2万円台最強タブレット
がじぇっとりっぷがタイムセール記事でたびたび取り上げているタブレットがAlldocube「iPlay50 Pro」。Helio G99というミドルクラスのSoCを搭載しながら実売価格が2万円台前半と安く、「これは当たり機種だ!」と確信を持っ
メーカー Khadas Khadas Khadas Khadas Teclast Alldocube
モデル名 VIM4 NPU VIM4 Edge2 VIM1S P40HD iPlay50 Pro
CPU A311D2-N0D A311D2 RK3588S S905Y4 Unisoc T606 Helio G99
メモリ 8GB 8GB 8GB 2GB 6GB 8GB
ストレージ 32GB eMMC 32GB eMMC 32GB eMMC 16GB eMMC 128GB UFS 256GB UFS
OS Android 11 Android 11 Android 12 Android 11 Android 12 Android 12
AnTuTu (v9) 総合 265880 280430 552582 88770 234677 359132
CPU 60255 64514 130750 20326 62146 103082
GPU 83280 85265 237229 9596 35130 85789
MEM 45342 50153 61646 27474 72720 73038
UX 77003 80498 122957 31374 64681 97223
AnTuTu (v10) 総合 301419 292159 568757 動作不可 267365 416037
CPU 88704 88207 173856 動作不可 82221 138802
GPU 61845 62469 164869 動作不可 28416 79883
MEM 74298 67007 97107 動作不可 99866 97627
UX 76572 74476 132925 動作不可 56862 99725
GeekBench 5 シングル 330 338 613 115 308 548
マルチ 1543 1565 2052 383 1326 1835
Compute 2105 2093 4393 381 517 1544
GeekBench 6 シングル 367 367 818 非対応 367 724
マルチ 1460 1449 2349 非対応 1360 2015
Compute 1871 1930 3549 非対応 448 1295
GeekBench ML CPU 159 161 270 非対応 163 263
GPU 147 147 777 非対応 193 470
NPU 5 5 242 非対応 111 完走できず
3DMark Wild Life 1074 1126 4182 416 1246
Wild Life Unlimited 1138 4125 414 1231
Wild Life EX 305 310 1116 114 344
Sling Shot 2510 2820 6474 594 1417 3522
Sling Shot Unlimited 2865 7049 586 1501 3780
Sling Shot EX 1949 2078 5490 952 2593
IceStorm Maxed out Maxed out Maxed out Maxed out Maxed out Maxed out
IceStorm EX Maxed out Maxed out Maxed out 10084 Maxed out Maxed out
IceStorm Unlimited 28046 64768 5994 16488 32695
PassMark System 4870 4819 9601 1512 6286 9766
CPU 3747 3719 4774 669 2977 4744
Memory 15270 14648 16178 3738 12065 16196
Disk 20230 22516 27313 11809 68125 57356
2D 13899 13804 28996 10267 14479 23207
3D 40626 40512 30725 7955 10585 21681
ブラウザ jetstream2 37.122 45.466 81.209 17.823 40.959 68.892
BaseMark 213.67 125.23 394.23 94.27 215.73 290.9
WebXPRT3 63 67 97 36 68 98
WebXPRT4 41 44 65 21 44 72
MotionMark 63.12 107.51 695.47 30.31 51.81 32.37
Octane 11384 9788 25061 4230 11126 22248
Speedometer 27.95 20.2 80.6 13.84 32.59 42.6
PCMark Work 3.0 6431 7257 9422 4212 7249 8875
Battery (100%) 4h29m 7h48m
Battery (50%) 7h48m 15h55m
Burnout 13.3 完走不可 24.6 1 7.8 12.7
AI-Benchmark 33.4 23.5 96.7 動作不可 38.1 70.5
AiTuTu 総合 211680 31695 79593 49074 67167 80165
Image 72177 0 33027 24775 28303 30230
Object 72475 31695 41083 24064 36410 33053
SR 67028 0 5483 535 2449 16882

AI向けのGeekBench MLでの値がやたら低いのが気になります。

中を見るとint8(8bit整数)の計算だけができていて、FP32およびFP16(32bitおよび16bit浮動小数)での計算ができていません。
というかこれ、「VIM4」と同じスコアなので、NNAPI(Android Neural Networks API)を叩いているのに、NPUではなくてCPUで計算していますね

Linux

Linuxではタブレットのベンチマークはないので、代わりにOKdo「Nano C100」(Jetson Nano互換品)を比較対象に追加しています。

【レビュー】 OKdo Nano C100 開発キット:もうひとひねり欲しい、Jetson Nano B01の互換キット
NVIDIAの「Jetson」シリーズはAI(機械学習)処理に適したSBC(シングルボードコンピューター)です。中身的には普通のSBCとあまり変わりませんが、AI処理に必要なGPUが強化されているのが大きな違いとなります。「Jetson」シ

UnixBench

Linux系はまず定番のUnixBenchから。

$ git clone https://github.com/kdlucas/byte-unixbench
$ cd byte-unixbench/UnixBench
$ ./Run
CPU UNIX Bench
Edge2 5079.91040.9
Orange Pi 5 4886904.9
VIM4 3099.2547.8
VIM4 NPU 3078541.2
NanoPC-T4 1299.1392.6
Nano C100 (10W) 1262.7342.6
VIM1S 1146367.4
Raspverry Pi 4 1094.6369.3
Nano C100 (5W) 429.3245

上段:マルチスレッド、下段:シングルスレッド

UnixBenchでは、まあまあのところに付けています。
「Raspverry Pi 4」の2.8倍って、考えてみたら結構強力ですね。

GeekBench

WindowsではおなじみのGeekBenchには、実はARM/RISC-V向けのベータ版が存在します。
ただし、実行はCUIで行い、結果は提示されたURLを見に行くスタイルです

Preview Versions - Geekbench
// GeekBench 5
$ wget https://cdn.geekbench.com/Geekbench-5.5.1-LinuxARMPreview.tar.gz
$ tar -zxvf Geekbench-5.5.1-LinuxARMPreview.tar.gz
$ cd Geekbench-5.5.1-LinuxARMPreview/
$ ./geekbench5

// GeekBench 6
$ wget https://cdn.geekbench.com/Geekbench-6.1.0-LinuxARMPreview.tar.gz
$ tar -zxvf Geekbench-6.1.0-LinuxARMPreview.tar.gz
$ cd Geekbench-6.1.0-LinuxARMPreview/
$ ./geekbench6
CPU GeekBench5
Edge2 2657653
Orange Pi 5 2627655
VIM4 1653352
VIM4 NPU 1501351
Nano C100 (10W) 831231
NanoPC-T4 731248
Raspverry Pi 4 666230
VIM1S 450138
Nano C100 (5W) 296154

上段:マルチスレッド、下段:シングルスレッド

GeekBench5のスコアだとRaspverry Pi 4の2.25倍程度。UnixBenchより差が小さくなっていますが、依然として強力であることに変わりはありません。

「VIM4」とは微妙に差があるのですが、個体差でしょうか?

PassMark

PassMarkもARM版が存在します。
32bit版と64bit版があり、「VIM4 NPU」は64bit版を使います。

Download PassMark PerformanceTest - PC Benchmark Software
Benchmark the speed of your PC computer hardware, then compare the result to other machines. Includes disk, 3D and CPU t
// 足りないライブラリを追加しておく
$ sudo apt install libncurses5

$ wget https://www.passmark.com/downloads/pt_linux_arm64.zip
$ unzip pt_linux_arm64.zip
$ cd PerformanceTest/
$ ./pt_linux_arm64
CPU PassMark
Orange Pi 5 31851503
Edge2 31101224
VIM4 19031040
VIM4 NPU 18891039
NanoPC-T4 1112639
Nano C100 (10W) 987589
VIM1S 549439
Raspverry Pi 4 512596
Nano C100 (5W) 327485

上段:CPU、下段:メモリ

PassMarkは「VIM4」と誤差程度に。まぁNPU以外は同じですし…

glmark2

GLMark2はLinux系では定番のグラフィックベンチマークの一つで、名前の通りOpenGL 2.0を使用して計測します。
OpenGL ES2.0を使うバージョン(glmark2-es2)もあるのですが、スコアがかけ離れるため、glmark2で統一したので比較データが少ないです。

$ sudo apt install glmark2
$ glmark2
CPU glmark2
Edge2 175
VIM4 130
VIM4 NPU 129
VIM1S 44

上段:CPU、下段:メモリ

MNIST

MNISTは機械学習系のベンチマークです。
正確にはベンチマークではないのですが、実行時間をベンチマークとして利用できます。
MNISTは手書き数字画像60,000枚と、テスト画像10,000枚を集めた画像データセットのことで、機械学習入門としてよく使われます。

ただし、CUDA系のベンチマークなので、NPUは使われないようです。

// Tensorflowのインストール
$ sudo apt update // updateしておかないとエラーが出る
$ sudo apt install python3-pip // SBCはpipが入っていないことが多い
$ pip3 install tensorflow

// MNISTの実行サンプルをダウンロード
$ git clone https://github.com/tak6uch1/cuda-tensorflow
$ cd cuda-tensorflow/work

// 実行
$ time python3 mnist_cnn.py
real user sys
VIM4 NPU 30m1.411s 190m28.593s 5m46.950s
VIM4 29m32.821s 185m41.339s 4m49.974s
Edge2 16m37.055s 102m20.492s 3m43.342s
VIM1S 133m10.630s 486m33.339s 4m0.410s

timeコマンドは以下のように見ます。

real:実際にかかった時間
user:プログラムの処理時間(各CPUコアの積算)
sys:プログラムに絡んでプログラム以外にCPUを浸かった時間

かかった時間は「VIM4」とほぼ同じ。
つまり、MNISTはNPUを使わず、CPUで計算処理が行われていたことを意味します。
まぁそもそも、CUDAコアを搭載したGPU向けのベンチなので…

AI-Benchmark

AI-BenchmarkはMobileNet-V2やInception-V4、DeepLabなど主要なモデルを網羅したベンチマークで、19セクション、42テストを行います。
各セクションの処理時間がベンチマークとして使用できます。
どうも20分程度でタイムアウトするようで、途中までしか計測できません。

// Tensorflowのインストールは省略(上を参照)
// 1.24以降だとエラーが出るので、numpyをバージョンダウンしておく
$ pip uninstall numpy
$ pip install numpy==1.23.1

$ pip install ai-benchmark
$ python3 -c "from ai_benchmark import AIBenchmark; results = AIBenchmark().run()"
CPU AI-Benchmark(←Better)
Edge2 1293ms2893ms
VIM4 NPU 2184ms5520ms
VIM4 21145597ms
VIM1S 7540timeout

上段:MobileNet-V2、下段:Inseption-V3

ここで「VIM4」と差が付くと思っていたのに、結果は誤差程度に。
CPUを使わないオプションを付けて AIBenchmark(use_CPU=None) としても結果は変わらなかったので、どうもCPU・NPUは使わずGPUで計算している模様

あれこれベンチマークを探したのですが、現状ではLinuxで手軽にNPUの差を見ることはできなさそうです。

外観

外箱です。

パッケージ一覧。
中身はマニュアルとカード(ドキュメントのURLが書かれているだけ)、アンテナとシンプル。

サイズ感はiPhone8どころか、iPhone4よりも小さいサイズ。

表側全体。

裏側です。

インターフェース。

反対のGPIOピン側。
左に見えるのはHDMI-INで、HDMI-INとGPIOピンの間にマイクがあります。

ボタンは3つ。左からP(Power)、F(Function)、R(Reset)です。

Wi-fiアンテナ差込口。
AとBと書かれていて、アンテナ側と対応しているので、きちんと確認していれば間違えることはないでしょう。

ファン付きヒートシンクを外したところ。

SoCには「A311D2-N0D」の文字。

下2つのメモリはSKHynix製、右のストレージ(eMMC)はSamsung製でした。

Wi-fiはAP6275S、有線LANチップ(GbE)はRealtek 8211FD、パルストランスにH5120NLを実装しています。

拡張ボード

当たり前の話ですが、「VIM4 NPU」では「VIM4」用の拡張ボードが使えます

拡張ボードを装着し、M.2 SSDを付けたところ。

created by Rinker
Khadas
¥1,100 (2025/06/17 13:55:02時点 Amazon調べ-詳細)

他モデルと比較

「VIM1S」と「VIM4」と並べたところ。
サイズは全く同じです。

インターフェース配置は共通で、入れ替えが容易です。

SoCしか違わない「VIM4」とはそっくりで、見分けるポイントはバージョン番号と、裏面のQRコードシールに書かれた「NPU」の文字くらいという。

OOWOW

「VIM4 NPU」はKhadas独自の「OOWOW」という管理ツールに対応しています。
マニュアルにも書かれていますが、「OOWOW」は”F”ボタンを押しながら”R”でリセットすると、5秒程度で起動します。

ネットワークにつないだら、OSを選択するだけのお手軽インストール。
気軽にOSを変更できますし、非常に便利です。

それにしても、バージョン違い含めて選択肢がだいぶ増えたなぁ…

Android

Androidは最新バージョンがなぜか起動しなかったので、ひとつ前のバージョンをインストール。

Khadas独自の項目「Khadas Setting」があり、画面の回転(アプリによっては強制的に戻される)やファンの回転制御、HDMI-INなどスマホでは存在しないような項目がまとめられています。

Ubuntu

Ubuntuは最新版で特に問題なくインストール完了。
AndroidもですがOOWOWとはWI-fiの管理が別なので、改めて接続する必要があります。

SSHでつないだらこう。
機種ごとに作りこまれています。

まとめ

「VIM4 NPU」の価格は、冷却ユニット込みで32,800円
NPUなしの「VIM4(冷却ユニット)」(29,800円)とは3,000円差です。

NPUの活用方法としてはやはり画像認識・音声認識が主流で、自動運転における物体(車・人・看板etc)認識や、工場のラインにおける不良品検知など、使いどころは広がっています。
とはいえパイは大きいとは言えないので、全部NPU付きにすべきと言えないのがなかなかに難しいところ。
今のところ世の中の大半の処理はNPUを必要としていないですしね。

「VIM4 NPU」の3.2TOPSより強力な6.0TOPSのNPUを内蔵する「Edge2」とは価格が近い(ヒートシンクと合わせて37,380円)ものの、ベンチマークを見る限りでは得意・不得意が違う感じなので、うまく住み分けができるんじゃないかなぁと。
まぁ、「Edge2」はパワフルなCPUによるごり押しができるんですけど。

ハマれば強いものの、そのハマりどころを探すのが大変。「VIM4 NPU」はそんな感じの一台と言えそうです。

関連リンク

付録:上で掲載しなかったベンチマーク結果画像

付録:ベンチマーク生データ

========================================================================
   BYTE UNIX Benchmarks (Version 5.1.3)

   System: Khadas: GNU/Linux
   OS: GNU/Linux -- 5.4.180 -- #1.5 SMP PREEMPT Tue Apr 25 12:26:22 UTC 2023
   Machine: aarch64 (aarch64)
   Language: en_US.utf8 (charmap="UTF-8", collate="UTF-8")
   CPU 0:  (48.0 bogomips)

   CPU 1:  (48.0 bogomips)

   CPU 2:  (48.0 bogomips)

   CPU 3:  (48.0 bogomips)

   CPU 4:  (48.0 bogomips)

   CPU 5:  (48.0 bogomips)

   CPU 6:  (48.0 bogomips)

   CPU 7:  (48.0 bogomips)

   17:09:56 up  1:10,  2 users,  load average: 10.18, 28.64, 19.48; runlevel 2023-08-16

------------------------------------------------------------------------
Benchmark Run: Wed Aug 16 2023 17:09:56 - 17:38:05
8 CPUs in system; running 1 parallel copy of tests

Dhrystone 2 using register variables       20031313.2 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                     3780.8 MWIPS (10.0 s, 7 samples)
Execl Throughput                               1623.9 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks        176443.2 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           49708.9 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        510762.0 KBps  (30.0 s, 2 samples)
Pipe Throughput                              294818.5 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                  63829.9 lps   (10.0 s, 7 samples)
Process Creation                               4209.6 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   4700.1 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   2420.4 lpm   (60.0 s, 2 samples)
System Call Overhead                         319243.0 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   20031313.2   1716.5
Double-Precision Whetstone                       55.0       3780.8    687.4
Execl Throughput                                 43.0       1623.9    377.7
File Copy 1024 bufsize 2000 maxblocks          3960.0     176443.2    445.6
File Copy 256 bufsize 500 maxblocks            1655.0      49708.9    300.4
File Copy 4096 bufsize 8000 maxblocks          5800.0     510762.0    880.6
Pipe Throughput                               12440.0     294818.5    237.0
Pipe-based Context Switching                   4000.0      63829.9    159.6
Process Creation                                126.0       4209.6    334.1
Shell Scripts (1 concurrent)                     42.4       4700.1   1108.5
Shell Scripts (8 concurrent)                      6.0       2420.4   4033.9
System Call Overhead                          15000.0     319243.0    212.8
                                                                   ========
System Benchmarks Index Score                                         541.2

------------------------------------------------------------------------
Benchmark Run: Wed Aug 16 2023 17:38:05 - 18:06:22
8 CPUs in system; running 8 parallel copies of tests

Dhrystone 2 using register variables      124476257.1 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                    26268.9 MWIPS (9.9 s, 7 samples)
Execl Throughput                               9019.5 lps   (30.0 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks       1250804.0 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks          352346.0 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks       3432632.1 KBps  (30.0 s, 2 samples)
Pipe Throughput                             2552640.4 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 419653.2 lps   (10.0 s, 7 samples)
Process Creation                              20634.6 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                  19320.4 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                   2679.7 lpm   (60.1 s, 2 samples)
System Call Overhead                        3555195.8 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0  124476257.1  10666.3
Double-Precision Whetstone                       55.0      26268.9   4776.2
Execl Throughput                                 43.0       9019.5   2097.5
File Copy 1024 bufsize 2000 maxblocks          3960.0    1250804.0   3158.6
File Copy 256 bufsize 500 maxblocks            1655.0     352346.0   2129.0
File Copy 4096 bufsize 8000 maxblocks          5800.0    3432632.1   5918.3
Pipe Throughput                               12440.0    2552640.4   2052.0
Pipe-based Context Switching                   4000.0     419653.2   1049.1
Process Creation                                126.0      20634.6   1637.7
Shell Scripts (1 concurrent)                     42.4      19320.4   4556.7
Shell Scripts (8 concurrent)                      6.0       2679.7   4466.1
System Call Overhead                          15000.0    3555195.8   2370.1
                                                                   ========
System Benchmarks Index Score                                        3078.0
                          PassMark PerformanceTest Linux

Khadas VIM4
Cortex-A53 (aarch64)
4 cores @ 2208 MHz  |  7.6 GiB RAM
Number of Processes: 8  |  Test Iterations: 1  |  Test Duration: Medium
--------------------------------------------------------------------------
CPU Mark:                          1889
  Integer Math                     26885 Million Operations/s
  Floating Point Math              6907 Million Operations/s
  Prime Numbers                    8.6 Million Primes/s
  Sorting                          10090 Thousand Strings/s
  Encryption                       393 MB/s
  Compression                      16855 KB/s
  CPU Single Threaded              581 Million Operations/s
  Physics                          214 Frames/s
  Extended Instructions (NEON)     1079 Million Matrices/s

Memory Mark:                       1039
  Database Operations              1255 Thousand Operations/s
  Memory Read Cached               6565 MB/s
  Memory Read Uncached             6286 MB/s
  Memory Write                     6721 MB/s
  Available RAM                    4805 Megabytes
  Memory Latency                   95 Nanoseconds
  Memory Threaded                  13987 MB/s
--------------------------------------------------------------------------

Results not submitted
Upload results to cpubenchmark.net? [Y/n]:

Use ESC or CTRL-C to exit
A: Run All Tests   C: Run CPU Tests   M: Run Memory Tests   U: Upload Test Results
=======================================================
    glmark2 2021.02
=======================================================
    OpenGL Information
    GL_VENDOR:     Mesa/X.org
    GL_RENDERER:   llvmpipe (LLVM 15.0.6, 128 bits)
    GL_VERSION:    4.5 (Compatibility Profile) Mesa 22.2.5
=======================================================
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#mb2371b8]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#vc6b9d86]
[build] use-vbo=false: FPS: 159 FrameTime: 6.289 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#db262bef]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#o6c6e06b]
[build] use-vbo=true: FPS: 160 FrameTime: 6.250 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#m236c794]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#kd1d0286]
[texture] texture-filter=nearest: FPS: 295 FrameTime: 3.390 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#g89619f6]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#b873484a]
[texture] texture-filter=linear: FPS: 275 FrameTime: 3.636 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#m9098117]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#af6e536e]
[texture] texture-filter=mipmap: FPS: 224 FrameTime: 4.464 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#c4b2125a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#yecb3af0]
[shading] shading=gouraud: FPS: 111 FrameTime: 9.009 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#x16ebf76]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#d019327d]
[shading] shading=blinn-phong-inf: FPS: 104 FrameTime: 9.615 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#o82247f1]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#kd1c5c20]
[shading] shading=phong: FPS: 90 FrameTime: 11.111 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#m7c059c6]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#m0975cd0]
[shading] shading=cel: FPS: 93 FrameTime: 10.753 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#s214d075]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#d4399ce5]
[bump] bump-render=high-poly: FPS: 46 FrameTime: 21.739 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#acfe3345]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#k16c221c]
[bump] bump-render=normals: FPS: 259 FrameTime: 3.861 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#e36f88a1]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#z21a1e99]
[bump] bump-render=height: FPS: 227 FrameTime: 4.405 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#t2a1479a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#j0b63854]
[effect2d] kernel=0,1,0;1,-4,1;0,1,0;: FPS: 137 FrameTime: 7.299 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#kbab73ef]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#h4caede1]
[effect2d] kernel=1,1,1,1,1;1,1,1,1,1;1,1,1,1,1;: FPS: 120 FrameTime: 8.333 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#qa896a83]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#fc6bec1c]
[pulsar] light=false:quads=5:texture=false: FPS: 228 FrameTime: 4.386 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#i878a218]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#t0455079]
[desktop] blur-radius=5:effect=blur:passes=1:separable=true:windows=4: FPS: 41 FrameTime: 24.390 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#x3c341dd]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#mabddbfd]
[desktop] effect=shadow:windows=4: FPS: 87 FrameTime: 11.494 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#lc59f826]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#xbb91478]
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 75 FrameTime: 13.333 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#n50a4c4c]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#uf68f947]
[buffer] columns=200:interleave=false:update-dispersion=0.9:update-fraction=0.5:update-method=subdata: FPS: 76 FrameTime: 13.158 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#s9746710]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#l4856738]
[buffer] columns=200:interleave=true:update-dispersion=0.9:update-fraction=0.5:update-method=map: FPS: 80 FrameTime: 12.500 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#he0136ad]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#rb13d6f4]
[ideas] speed=duration: FPS: 93 FrameTime: 10.753 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#e2f78163]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#v5f3b6c9]
[jellyfish] : FPS: 59 FrameTime: 16.949 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#dd1e7d79]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#z5d606de]
[terrain] : FPS: 3 FrameTime: 333.333 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#cb034a44]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#jcbc9c33]
[shadow] : FPS: 77 FrameTime: 12.987 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#qc5b8578]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#za054529]
[refract] : FPS: 9 FrameTime: 111.111 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#mab72f5a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#xdd161dc]
[conditionals] fragment-steps=0:vertex-steps=0: FPS: 152 FrameTime: 6.579 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#n61d087a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#m6c80964]
[conditionals] fragment-steps=5:vertex-steps=0: FPS: 143 FrameTime: 6.993 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#c85c4c5f]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#x5be02c5]
[conditionals] fragment-steps=0:vertex-steps=5: FPS: 153 FrameTime: 6.536 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#r972042f]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#ld1d8364]
[function] fragment-complexity=low:fragment-steps=5: FPS: 146 FrameTime: 6.849 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#p5e8a61a]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#ec115ef1]
[function] fragment-complexity=medium:fragment-steps=5: FPS: 132 FrameTime: 7.576 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#z41830a1]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#y139cade]
[loop] fragment-loop=false:fragment-steps=5:vertex-steps=5: FPS: 144 FrameTime: 6.944 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#x9e85eb0]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#t9c7baa2]
[loop] fragment-steps=5:fragment-uniform=false:vertex-steps=5: FPS: 143 FrameTime: 6.993 ms
** GLX does not support GLX_EXT_swap_control or GLX_MESA_swap_control! [#g5474a6f]
** Failed to set swap interval. Results may be bounded above by refresh rate. [#icf08d6c]
[loop] fragment-steps=5:fragment-uniform=true:vertex-steps=5: FPS: 135 FrameTime: 7.407 ms
=======================================================
                                  glmark2 Score: 129 
=======================================================
>>   AI-Benchmark-v.0.1.2
>>   Let the AI Games begin..

*  TF Version: 2.13.0
*  Platform: Linux-5.4.180-aarch64-with-glibc2.35
*  CPU: N/A
*  CPU RAM: 8 GB

The benchmark is running...
The tests might take up to 20 minutes
Please don't interrupt the script

1/19. MobileNet-V2

1.1 - inference | batch=50, size=224x224: 2184 ± 68 ms
1.2 - training  | batch=50, size=224x224: 6920 ± 76 ms

2/19. Inception-V3

2.1 - inference | batch=20, size=346x346: 5520 ± 35 ms
2.2 - training  | batch=20, size=346x346: 20830 ± 21 ms

3/19. Inception-V4

3.1 - inference | batch=10, size=346x346: 5516 ± 10 ms
3.2 - training  | batch=10, size=346x346: 20162 ± 40 ms

4/19. Inception-ResNet-V2

4.1 - inference | batch=10, size=346x346: 6490 ± 11 ms
4.2 - training  | batch=8, size=346x346: 19052 ± 35 ms

5/19. ResNet-V2-50

5.1 - inference | batch=10, size=346x346: 3586 ± 29 ms
5.2 - training  | batch=10, size=346x346: 12498 ± 100 ms

6/19. ResNet-V2-152

6.1 - inference | batch=10, size=256x256: 5708 ± 20 ms
6.2 - training  | batch=10, size=256x256: 21572 ± 113 ms

コメント

タイトルとURLをコピーしました