Performanta Modelului

PCA (150 componente, whitened) + SVM (kernel RBF)

87.30% acuratete pe setul de test (244 imagini)

Matricea de Confuzie

Randul \(i\), coloana \(j\): numarul de imagini din clasa \(i\) clasificate ca \(j\). Diagonala principala contine predictiile corecte.

Confusion matrix
Distributia claselor

Dezechilibru puternic: George W. Bush are de ~7x mai multe imagini decat Ariel Sharon. Compensat cu class_weight='balanced'.

Class distribution
Acuratete per persoana

Clasele cu mai putine imagini tind sa aiba acuratete mai mica.

Accuracy per class
Classification Report

Celulele sunt colorate: verde = ≥ 0.85, galben = 0.65–0.85, rosu = < 0.65. Linia finala = medie ponderata.

Persoana Precizie Recall F1-score Support
Ariel Sharon 1.00 0.62 0.77 16
Colin Powell 0.81 0.91 0.86 47
Donald Rumsfeld 0.90 0.79 0.84 24
George W Bush 0.88 0.97 0.92 106
Gerhard Schroeder 0.94 0.68 0.79 22
Tony Blair 0.85 0.79 0.82 29
Medie ponderata 0.88 0.87 0.87 244
Scree Plot — Varianta Explicata

Cat din varianta totala captureaza primele \(k\) componente. Linia rosie marcheaza pragul de 95%.

Scree plot
Eroare de Reconstructie vs k

Eroarea medie patratica (MSE) scade pe masura ce adaugam componente. Complementar scree plot-ului: perspectiva din unghiul erorii.

Reconstruction error
Proiectie PCA 2D

Fiecare punct este o imagine proiectata pe primele doua componente principale \((z_1, z_2)\). Separabilitatea claselor vizibila in 2D justifica de ce SVM functioneaza bine in spatiul PCA de 150 dimensiuni.

PCA 2D scatter