Apprendimento automatico non supervisionato: Algorithms, Tipi con esempio
Cos'รจ l'apprendimento non supervisionato?
Apprendimento senza supervisione รจ una tecnica di apprendimento automatico in cui gli utenti non hanno bisogno di supervisionare il modello. Invece, consente al modello di funzionare da solo per scoprire modelli e informazioni precedentemente non rilevati. Si occupa principalmente dei dati non etichettati.
Apprendimento senza supervisione Algorithms
Apprendimento senza supervisione Algorithms consentono agli utenti di eseguire attivitร di elaborazione piรน complesse rispetto all'apprendimento supervisionato. Tuttavia, l'apprendimento non supervisionato puรฒ essere piรน imprevedibile rispetto ad altri metodi di apprendimento naturale. Gli algoritmi di apprendimento non supervisionato includono clustering, rilevamento delle anomalie, reti neurali, ecc.
Esempio di machine learning non supervisionato
Prendiamo un esempio di apprendimento non supervisionato per un bambino e il suo cane di famiglia.
Lei conosce e identifica questo cane. Poche settimane dopo un amico di famiglia porta con sรฉ un cane e cerca di giocare con il bambino.
Il bambino non ha mai visto questo cane prima. Ma riconosce molte caratteristiche (2 orecchie, occhi, cammina su 4 zampe) come se fosse il suo cane da compagnia. Identifica il nuovo animale come un cane. Questo รจ un apprendimento non supervisionato, in cui non ti viene insegnato ma impari dai dati (in questo caso i dati su un cane). Se questo fosse stato apprendimento supervisionato, l'amico di famiglia avrebbe detto al bambino che รจ un cane, come mostrato nell'esempio di apprendimento non supervisionato sopra.
Perchรฉ lโapprendimento non supervisionato?
Ecco i motivi principali per utilizzare l'apprendimento non supervisionato in machine Learning:
- Lโapprendimento automatico non supervisionato trova tutti i tipi di modelli sconosciuti nei dati.
- I metodi non supervisionati ti aiutano a trovare funzionalitร che possono essere utili per la categorizzazione.
- Si svolge in tempo reale, quindi tutti i dati di input devono essere analizzati ed etichettati in presenza degli studenti.
- ร piรน semplice ottenere dati senza etichetta da un computer rispetto a dati etichettati, che richiedono un intervento manuale.
ClusterTipi di apprendimento non supervisionato Algorithms
Di seguito sono riportati i tipi di clustering degli algoritmi di Machine Learning non supervisionati:
Problemi di apprendimento non supervisionato ulteriormente raggruppati in problemi di clustering e associazione.
ClusterING

ClusterL'apprendimento รจ un concetto importante quando si parla di apprendimento non supervisionato. Si occupa principalmente di trovare una struttura o un modello in una raccolta di dati non categorizzati. Apprendimento non supervisionato ClusterGli algoritmi di ing elaboreranno i tuoi dati e troveranno cluster (gruppi) naturali se esistono nei dati. Puoi anche modificare quanti cluster i tuoi algoritmi dovrebbero identificare. Ti consente di regolare la granularitร di questi gruppi.
Esistono diversi tipi di clustering che puoi utilizzare:
Esclusivo (partizionamento)
In questo metodo di clustering, i dati sono raggruppati in modo tale che un dato possa appartenere a un solo cluster.
Esempio: K-significa
agglomerante
In questa tecnica di clustering, ogni dato รจ un cluster. Le unioni iterative tra i due cluster piรน vicini riducono il numero di cluster.
Esempio: Clustering gerarchico
Sovrapposizione
In questa tecnica, i set fuzzy vengono utilizzati per raggruppare i dati. Ogni punto puรฒ appartenere a due o piรน cluster con gradi di appartenenza distinti.
Qui, i dati verranno associati a un valore di iscrizione appropriato. Esempio: medie C fuzzy
probabilistico
Questa tecnica utilizza la distribuzione di probabilitร per creare i cluster
Esempio: parole chiave seguenti
- โscarpa da uomoโ.
- โscarpa da donnaโ.
- "guanto da donna."
- "guanto da uomo."
possono essere raggruppati in due categorie โscarpeโ e โguantiโ o โuomoโ e โdonneโ.
Clustertipi
Di seguito sono riportati i tipi di clustering del Machine Learning:
- Clustering gerarchico
- K significa clustering
- K-NN (k vicini piรน prossimi)
- Analisi del componente principale
- Scomposizione di un valore singolo
- Analisi dei componenti indipendenti
Hierarchical ClusterING
Il clustering gerarchico รจ un algoritmo che costruisce una gerarchia di cluster. Inizia con tutti i dati che sono assegnati a un cluster a sรฉ stante. Qui, due cluster vicini saranno nello stesso cluster. Questo algoritmo termina quando rimane un solo cluster.
K-significa ClusterING
K significa che รจ un algoritmo di clustering iterativo che ti aiuta a trovare il valore piรน alto per ogni iterazione. Inizialmente, viene selezionato il numero desiderato di cluster. In questo metodo di clustering, รจ necessario raggruppare i punti dati in k gruppi. Un k piรน grande significa gruppi piรน piccoli con maggiore granularitร allo stesso modo. Un k inferiore significa gruppi piรน grandi con meno granularitร .
L'output dell'algoritmo รจ un gruppo di "etichette". Assegna il punto dati a uno dei gruppi k. Nel clustering k-means, ciascun gruppo viene definito creando un centroide per ciascun gruppo. I centroidi sono come il cuore dell'ammasso, che cattura i punti a loro piรน vicini e li aggiunge all'ammasso.
Il clustering K-mean definisce ulteriormente due sottogruppi:
- Raggruppamento agglomerativo
- Dendrogramma
Raggruppamento agglomerativo
Questo tipo di clustering K-means inizia con un numero fisso di cluster. Assegna tutti i dati nel numero esatto di cluster. Questo metodo di clustering non richiede il numero di cluster K come input. Il processo di agglomerazione inizia formando ciascun dato come un singolo cluster.
Questo metodo utilizza alcune misure di distanza e riduce il numero di cluster (uno in ciascuna iterazione) mediante il processo di unione. Infine, abbiamo un grande cluster che contiene tutti gli oggetti.
Dendrogramma
Nel metodo di clustering del Dendrogramma, ogni livello rappresenterร un possibile cluster. L'altezza del dendrogramma mostra il livello di somiglianza tra due cluster di join. Piรน si avvicinano alla fine del processo, piรน i cluster sono simili, il che risulta dal rilevamento del gruppo dal dendrogramma che non รจ naturale e per lo piรน soggettivo.
K- Vicini piรน prossimi
K- nearest neighbor รจ il piรน semplice di tutti i classificatori di apprendimento automatico. Si differenzia dalle altre tecniche di apprendimento automatico perchรฉ non produce un modello. ร un semplice algoritmo che memorizza tutti i casi disponibili e classifica le nuove istanze in base a una misura di similaritร .
Funziona molto bene quando c'รจ una distanza tra gli esempi. La velocitร di apprendimento รจ lenta quando il set di addestramento รจ ampio e il calcolo della distanza non รจ banale.
Analisi delle componenti principali
Nel caso in cui si desideri uno spazio di dimensione superiore. ร necessario selezionare una base per tale spazio e solo i 200 punteggi piรน importanti di tale base. Questa base รจ nota come componente principale. Il sottoinsieme che si seleziona costituisce un nuovo spazio di piccole dimensioni rispetto allo spazio originale. Mantiene il piรน possibile la complessitร dei dati.
Associazione
Le regole di associazione consentono di stabilire associazioni tra oggetti dati all'interno di database di grandi dimensioni. Questa tecnica non supervisionata riguarda la scoperta di relazioni interessanti tra variabili in database di grandi dimensioni. Ad esempio, le persone che acquistano una nuova casa hanno maggiori probabilitร di acquistare nuovi mobili.
Altri esempi:
- Un sottogruppo di pazienti affetti da cancro raggruppati in base alle misurazioni dell'espressione genica
- Gruppi di acquirenti in base alla cronologia di navigazione e di acquisto
- Gruppo di film in base alla valutazione data dagli spettatori del film
Apprendimento automatico supervisionato e non supervisionato
Ecco la differenza principale tra Apprendimento supervisionato e non supervisionato:
| Scheda Sintetica | Tecnica di machine learning supervisionata | Tecnica di machine learning non supervisionata |
|---|---|---|
| Dati in ingresso | Algorithms vengono addestrati utilizzando dati etichettati. | Algorithms vengono utilizzati rispetto a dati non etichettati |
| Complessitร computazionale | Lโapprendimento supervisionato รจ un metodo piรน semplice. | L'apprendimento non supervisionato รจ computazionalmente complesso |
| Precisione | Metodo estremamente accurato e affidabile. | Less metodo accurato e affidabile. |
Applicazioni dell'apprendimento automatico non supervisionato
Alcune applicazioni delle tecniche di apprendimento non supervisionato sono:
- Clusterdividere automaticamente il set di dati in gruppi in base alle loro somiglianze
- Il rilevamento delle anomalie puรฒ scoprire punti dati insoliti nel set di dati. ร utile per trovare transazioni fraudolente
- L'estrazione associativa identifica insiemi di elementi che spesso si presentano insieme nel set di dati
- I modelli a variabili latenti sono ampiamente utilizzati per la preelaborazione dei dati. Come ridurre il numero di funzionalitร in un set di dati o scomporre il set di dati in piรน componenti
Svantaggi dell'apprendimento non supervisionato
- Non รจ possibile ottenere informazioni precise sull'ordinamento dei dati e l'output in quanto i dati utilizzati nell'apprendimento non supervisionato sono etichettati e non conosciuti
- Less l'accuratezza dei risultati รจ dovuta al fatto che i dati di input non sono noti e non sono etichettati in anticipo dalle persone. Ciรฒ significa che la macchina deve farlo da sola.
- Le classi spettrali non sempre corrispondono alle classi informative.
- L'utente deve dedicare tempo all'interpretazione e all'etichettatura delle classi che seguono tale classificazione.
- Le proprietร spettrali delle classi possono anche cambiare nel tempo, quindi non puoi avere le stesse informazioni sulla classe mentre ti sposti da un'immagine all'altra.
Sintesi
- L'apprendimento non supervisionato รจ una tecnica di machine learning, in cui non รจ necessario supervisionare il modello.
- L'apprendimento automatico non supervisionato ti aiuta a trovare tutti i tipi di modelli sconosciuti nei dati.
- Clustering e associazione sono due tipi di apprendimento non supervisionato.
- Quattro tipi di metodi di clustering sono 1) Esclusivo 2) Agglomerativo 3) Sovrapposto 4) Probabilistico.
- I tipi di clustering piรน importanti sono: 1) Clustering gerarchico, 2) Clustering K-means, 3) K-NN, 4) Analisi delle componenti principali, 5) Decomposizione dei valori singolari, 6) Analisi delle componenti indipendenti.
- Le regole di associazione consentono di stabilire associazioni tra oggetti dati all'interno di database di grandi dimensioni.
- Nell'apprendimento supervisionato, Algorithms vengono addestrati utilizzando dati etichettati durante l'apprendimento non supervisionato Algorithms vengono utilizzati rispetto a dati non etichettati.
- Il rilevamento delle anomalie puรฒ scoprire punti dati importanti nel tuo set di dati, utili per trovare transazioni fraudolente.
- Il piรน grande svantaggio dellโapprendimento non supervisionato รจ che non รจ possibile ottenere informazioni precise sullโordinamento dei dati.


