Performanta Modelului
PCA (150 componente, whitened) + SVM (kernel RBF)
Matricea de Confuzie
Randul \(i\), coloana \(j\): numarul de imagini din clasa \(i\) clasificate ca \(j\). Diagonala principala contine predictiile corecte.
Distributia claselor
Dezechilibru puternic: George W. Bush are de ~7x mai multe imagini
decat Ariel Sharon. Compensat cu class_weight='balanced'.
Acuratete per persoana
Clasele cu mai putine imagini tind sa aiba acuratete mai mica.
Classification Report
Celulele sunt colorate: verde = ≥ 0.85, galben = 0.65–0.85, rosu = < 0.65. Linia finala = medie ponderata.
| Persoana | Precizie | Recall | F1-score | Support |
|---|---|---|---|---|
| Ariel Sharon | 1.00 | 0.62 | 0.77 | 16 |
| Colin Powell | 0.81 | 0.91 | 0.86 | 47 |
| Donald Rumsfeld | 0.90 | 0.79 | 0.84 | 24 |
| George W Bush | 0.88 | 0.97 | 0.92 | 106 |
| Gerhard Schroeder | 0.94 | 0.68 | 0.79 | 22 |
| Tony Blair | 0.85 | 0.79 | 0.82 | 29 |
| Medie ponderata | 0.88 | 0.87 | 0.87 | 244 |
Scree Plot — Varianta Explicata
Cat din varianta totala captureaza primele \(k\) componente. Linia rosie marcheaza pragul de 95%.
Eroare de Reconstructie vs k
Eroarea medie patratica (MSE) scade pe masura ce adaugam componente. Complementar scree plot-ului: perspectiva din unghiul erorii.
Proiectie PCA 2D
Fiecare punct este o imagine proiectata pe primele doua componente principale \((z_1, z_2)\). Separabilitatea claselor vizibila in 2D justifica de ce SVM functioneaza bine in spatiul PCA de 150 dimensiuni.