Come testiamo i computer

Computer testing methods

Recensiamo molti computer su ENBLE, e lo facciamo da molto tempo. Nel corso degli anni, parte della metodologia è cambiata, ma il nostro impegno principale per recensioni approfondite dei prodotti è rimasto lo stesso. Il nostro processo di revisione per laptop, desktop, tablet e altri dispositivi simili a computer si compone di due parti: test di performance in condizioni controllate nei laboratori di ENBLE e un utilizzo approfondito da parte dei nostri esperti recensori. Questo include la valutazione dell’estetica, dell’ergonomia e delle caratteristiche del dispositivo. Il verdetto finale della recensione è una combinazione di giudizi sia oggettivi che soggettivi.

Quando un computer – tipicamente un laptop, desktop, ibrido 2-in-1 o Chromebook – arriva ai laboratori di ENBLE, lo configuriamo come farebbe un utente tipico del prodotto. Come pratica migliore, durante la configurazione disabilitiamo il più possibile le opzioni invasive di privacy e raccolta dati. Quindi aggiorniamo il sistema operativo, i driver della GPU, il BIOS e le utility del produttore secondo necessità e utilizziamo applicazioni come Sandra di SiSoftware, CPU-Z di CPUID, GPU-Z di TechPowerUp e così via per raccogliere informazioni sui componenti del sistema, come la CPU, la GPU, la RAM, l’SSD e la scheda madre.

I nostri test di benchmark consistono in un set di base che eseguiamo su ogni sistema compatibile, oltre a un set esteso di test per casi d’uso specifici, come il gaming o la creazione di contenuti, in cui i sistemi possono avere GPU più potenti o display ad alta risoluzione che devono essere valutati.

Dan Ackerman/CNET

L’elenco del software di benchmarking che utilizziamo cambia nel tempo man mano che i dispositivi che testiamo si evolvono. I test di base più importanti che stiamo attualmente eseguendo su ogni computer compatibile sono:

Primate Labs Geekbench 5 e 6 Eseguiamo sia i test della CPU single-core che multicore, e il test di calcolo Vulkan (Windows) o Metal (MacOS). Su Android, dispositivi Apple e Chromebooks, eseguiamo i test della CPU e il test di calcolo. I test della CPU di Geekbench misurano le prestazioni di un carico di lavoro misto. (Eseguiamo entrambe le versioni del benchmark per poter confrontare i modelli testati prima che fosse disponibile Geekbench 6.)

Cinebench R23 Eseguiamo sia i test single-core che multicore su dispositivi Windows e MacOS. Cinebench misura le prestazioni di elaborazione della CPU pura per il rendering 3D.

PCMark 10 Stiamo gradualmente eliminando questo benchmark per Windows, ma al momento ancora eseguiamo l’ultima versione della generazione precedente, che simula una vasta gamma di funzioni, tra cui navigazione web, videoconferenza, editing foto, editing video e altro ancora.

3DMark Wild Life Extreme Eseguiamo questo test su sistemi MacOS (Apple silicon), Windows, Android e iPadOS; è uno dei pochi benchmark multi-piattaforma disponibili per testare le prestazioni grafiche. Inoltre lo eseguiamo in modalità Unlimited, che elimina la risoluzione dello schermo come variabile durante i confronti tra dispositivi diversi.

3DMark Fire Strike Ultra, Time Spy e Port Royal Eseguiamo questi test su qualsiasi sistema con una GPU discreta per testare le prestazioni grafiche DirectX 11 e DirectX 12 di un sistema, che sono particolarmente importanti per i computer da gaming. Stiamo gradualmente eliminando Port Royal, che è specificamente progettato per testare le prestazioni di raytracing di Nvidia RTX, e passando a DXR o Speed Way di 3DMark (il primo testa le prestazioni di raytracing di DX12 Ultimate e il secondo testa una combinazione delle funzionalità di DX12 Ultimate). Abbiamo anche aggiunto i test di 3DMark CPU Profiler, Storage e PCI Features per comprendere i risultati che otteniamo da test con carichi di lavoro più misti.

Benchmark di Shadow of the Tomb Raider Si tratta di un vecchio gioco che può funzionare bene su hardware da gaming di fascia bassa. Bilancia i carichi di lavoro della CPU e della GPU anziché fare affidamento esclusivamente sulla GPU, e riporta come vengono utilizzati i due componenti. Eseguiamo il benchmark incorporato nel gioco su sistemi con una GPU discreta utilizzando il preset di qualità più alto con una risoluzione di 1.920×1.080.

Benchmark di Guardians of the Galaxy Un gioco più moderno che può ancora essere eseguito su hardware da gaming di fascia bassa, misura le prestazioni pure della GPU. Eseguiamo il test principale a una risoluzione di 1.920×1.080 pixel con qualità alta, ma su hardware rilevante potremmo eseguirlo a risoluzioni più elevate e con qualità superiore (ad esempio, con il raytracing abilitato) per il confronto.

Benchmark di CPU e GPU di The Rift Breaker The Rift Breaker incorpora sia azione che simulazione complessa, il che significa che può fare ampio uso sia della CPU che della GPU per diversi aspetti del gioco. Eseguiamo il test principale a una risoluzione di 1.920×1.080 pixel con qualità alta, ma su hardware rilevante potremmo eseguirlo a risoluzioni più elevate e con qualità superiore (ad esempio, con il raytracing abilitato) per il confronto.

Benchmark UL Procyon Se un sistema soddisfa i requisiti minimi per eseguire Adobe Premiere Pro e Photoshop con Photoshop Lightroom Classic, utilizziamo questi due benchmark con risoluzione di 1.920×1.080 pixel per valutare l’idoneità di un sistema alla creazione di contenuti. Forniscono anche un’immagine di come vengono gestiti i carichi di lavoro misti CPU e GPU, a differenza dei benchmark puramente GPU.

Test di durata della batteria Per tutti i computer dotati di batteria, modifichiamo le impostazioni in modo da evitare che il sistema vada in sleep o ibernazione, disabilitiamo i popup e le notifiche che potrebbero interferire con il test e impostiamo la luminosità dello schermo e il volume (uscita su auricolari) al 50%. Successivamente, riproduciamo in streaming un video personalizzato su YouTube in loop tramite Wi-Fi su Chrome e utilizziamo un’app di cronometro per tenere traccia del tempo durante il quale il sistema rimane attivo.

JetStream 2, MotionMark e WebXPRT 3 Eseguiamo questi test basati sul browser per valutare le prestazioni dei Chromebook e occasionalmente li eseguiamo anche sui sistemi Windows per confronto.

Josh Goldman/CNET

Test aggiuntivi

Potremmo eseguire una serie di test aggiuntivi o varianti dei test standard; ad esempio, eseguiamo Geekbench e Cinebench con alimentazione a batteria per valutare l’impatto delle impostazioni di risparmio energetico di un laptop sulle prestazioni. Per i sistemi con componenti potenti, potremmo eseguire cicli di altri benchmark per valutare la stabilità del sistema e la temperatura dei componenti a pieno carico.

I test discretionali possono includere anche le tecnologie di upscaling e ottimizzazione dei giochi DLSS 2 e 3 (su Nvidia), FidelityFX Super Resolution 2.x (su AMD) o XeSS (per hardware Intel) in 3DMark, nonché nei giochi che le supportano. Per i sistemi con schede grafiche di fascia media e superiore, a volte eseguiamo anche SpecViewPerf 2020 (creazione e analisi di contenuti professionali oltre all’editing di foto e video) o test anecdotali con OBS Studio (streaming).

Come parte di una recensione, di solito includiamo un grafico di confronto dei punteggi dei test rilevanti tra prodotti comparabili. Quando apportiamo una modifica importante ai test, come il passaggio da una versione di un test a un’altra, effettuiamo il test su entrambe le versioni o su tutto il set vecchio e nuovo per creare un database di dati di confronto.

Stiamo attualmente valutando altre due serie di benchmark per includerle nella nostra suite di test: i test di inferenza AI recentemente aggiunti da UL Procyon e Returnal, un gioco con grafica di alta qualità e un benchmark informativo.

Con così tanti computer che utilizzano gli stessi pochi processori e schede grafiche, gli stessi sistemi operativi e quantità simili di RAM e storage, i risultati di questi benchmark di solito corrispondono alle nostre aspettative. Ciò significa che osservando le specifiche di un sistema possiamo avere un’idea ragionevole delle sue prestazioni rispetto a sistemi con specifiche migliori o inferiori. È quando confrontiamo sistemi con specifiche simili che un particolare marchio può distinguersi come buono, non così buono o semplicemente sufficiente. Soprattutto per i laptop, le prestazioni riflettono le decisioni del produttore su come allocare la potenza, anche quando è collegato. È diventato particolarmente complicato, poiché ci possono essere più modi per modificare le impostazioni o regolazioni automatizzate “AI” che rendono impossibile sapere cosa sta realmente accadendo.