Apprendimento automatico non supervisionato: Algorithms, Tipi con esempio

Cos'รจ l'apprendimento non supervisionato?

Apprendimento senza supervisione รจ una tecnica di apprendimento automatico in cui gli utenti non hanno bisogno di supervisionare il modello. Invece, consente al modello di funzionare da solo per scoprire modelli e informazioni precedentemente non rilevati. Si occupa principalmente dei dati non etichettati.

Apprendimento senza supervisione Algorithms

Apprendimento senza supervisione Algorithms consentono agli utenti di eseguire attivitร  di elaborazione piรน complesse rispetto all'apprendimento supervisionato. Tuttavia, l'apprendimento non supervisionato puรฒ essere piรน imprevedibile rispetto ad altri metodi di apprendimento naturale. Gli algoritmi di apprendimento non supervisionato includono clustering, rilevamento delle anomalie, reti neurali, ecc.

Esempio di machine learning non supervisionato

Prendiamo un esempio di apprendimento non supervisionato per un bambino e il suo cane di famiglia.

Esempio di machine learning non supervisionato

Lei conosce e identifica questo cane. Poche settimane dopo un amico di famiglia porta con sรฉ un cane e cerca di giocare con il bambino.

Esempio di machine learning non supervisionato

Il bambino non ha mai visto questo cane prima. Ma riconosce molte caratteristiche (2 orecchie, occhi, cammina su 4 zampe) come se fosse il suo cane da compagnia. Identifica il nuovo animale come un cane. Questo รจ un apprendimento non supervisionato, in cui non ti viene insegnato ma impari dai dati (in questo caso i dati su un cane). Se questo fosse stato apprendimento supervisionato, l'amico di famiglia avrebbe detto al bambino che รจ un cane, come mostrato nell'esempio di apprendimento non supervisionato sopra.

Perchรฉ lโ€™apprendimento non supervisionato?

Ecco i motivi principali per utilizzare l'apprendimento non supervisionato in machine Learning:

  • Lโ€™apprendimento automatico non supervisionato trova tutti i tipi di modelli sconosciuti nei dati.
  • I metodi non supervisionati ti aiutano a trovare funzionalitร  che possono essere utili per la categorizzazione.
  • Si svolge in tempo reale, quindi tutti i dati di input devono essere analizzati ed etichettati in presenza degli studenti.
  • รˆ piรน semplice ottenere dati senza etichetta da un computer rispetto a dati etichettati, che richiedono un intervento manuale.

ClusterTipi di apprendimento non supervisionato Algorithms

Di seguito sono riportati i tipi di clustering degli algoritmi di Machine Learning non supervisionati:

Problemi di apprendimento non supervisionato ulteriormente raggruppati in problemi di clustering e associazione.

ClusterING

ClusterING
ClusterING

ClusterL'apprendimento รจ un concetto importante quando si parla di apprendimento non supervisionato. Si occupa principalmente di trovare una struttura o un modello in una raccolta di dati non categorizzati. Apprendimento non supervisionato ClusterGli algoritmi di ing elaboreranno i tuoi dati e troveranno cluster (gruppi) naturali se esistono nei dati. Puoi anche modificare quanti cluster i tuoi algoritmi dovrebbero identificare. Ti consente di regolare la granularitร  di questi gruppi.

Esistono diversi tipi di clustering che puoi utilizzare:

Esclusivo (partizionamento)

In questo metodo di clustering, i dati sono raggruppati in modo tale che un dato possa appartenere a un solo cluster.

Esempio: K-significa

agglomerante

In questa tecnica di clustering, ogni dato รจ un cluster. Le unioni iterative tra i due cluster piรน vicini riducono il numero di cluster.

Esempio: Clustering gerarchico

Sovrapposizione

In questa tecnica, i set fuzzy vengono utilizzati per raggruppare i dati. Ogni punto puรฒ appartenere a due o piรน cluster con gradi di appartenenza distinti.

Qui, i dati verranno associati a un valore di iscrizione appropriato. Esempio: medie C fuzzy

probabilistico

Questa tecnica utilizza la distribuzione di probabilitร  per creare i cluster

Esempio: parole chiave seguenti

  • โ€œscarpa da uomoโ€.
  • โ€œscarpa da donnaโ€.
  • "guanto da donna."
  • "guanto da uomo."

possono essere raggruppati in due categorie โ€œscarpeโ€ e โ€œguantiโ€ o โ€œuomoโ€ e โ€œdonneโ€.

Clustertipi

Di seguito sono riportati i tipi di clustering del Machine Learning:

  • Clustering gerarchico
  • K significa clustering
  • K-NN (k vicini piรน prossimi)
  • Analisi del componente principale
  • Scomposizione di un valore singolo
  • Analisi dei componenti indipendenti

Hierarchical ClusterING

Il clustering gerarchico รจ un algoritmo che costruisce una gerarchia di cluster. Inizia con tutti i dati che sono assegnati a un cluster a sรฉ stante. Qui, due cluster vicini saranno nello stesso cluster. Questo algoritmo termina quando rimane un solo cluster.

K-significa ClusterING

K significa che รจ un algoritmo di clustering iterativo che ti aiuta a trovare il valore piรน alto per ogni iterazione. Inizialmente, viene selezionato il numero desiderato di cluster. In questo metodo di clustering, รจ necessario raggruppare i punti dati in k gruppi. Un k piรน grande significa gruppi piรน piccoli con maggiore granularitร  allo stesso modo. Un k inferiore significa gruppi piรน grandi con meno granularitร .

L'output dell'algoritmo รจ un gruppo di "etichette". Assegna il punto dati a uno dei gruppi k. Nel clustering k-means, ciascun gruppo viene definito creando un centroide per ciascun gruppo. I centroidi sono come il cuore dell'ammasso, che cattura i punti a loro piรน vicini e li aggiunge all'ammasso.

Il clustering K-mean definisce ulteriormente due sottogruppi:

  • Raggruppamento agglomerativo
  • Dendrogramma

Raggruppamento agglomerativo

Questo tipo di clustering K-means inizia con un numero fisso di cluster. Assegna tutti i dati nel numero esatto di cluster. Questo metodo di clustering non richiede il numero di cluster K come input. Il processo di agglomerazione inizia formando ciascun dato come un singolo cluster.

Questo metodo utilizza alcune misure di distanza e riduce il numero di cluster (uno in ciascuna iterazione) mediante il processo di unione. Infine, abbiamo un grande cluster che contiene tutti gli oggetti.

Dendrogramma

Nel metodo di clustering del Dendrogramma, ogni livello rappresenterร  un possibile cluster. L'altezza del dendrogramma mostra il livello di somiglianza tra due cluster di join. Piรน si avvicinano alla fine del processo, piรน i cluster sono simili, il che risulta dal rilevamento del gruppo dal dendrogramma che non รจ naturale e per lo piรน soggettivo.

K- Vicini piรน prossimi

K- nearest neighbor รจ il piรน semplice di tutti i classificatori di apprendimento automatico. Si differenzia dalle altre tecniche di apprendimento automatico perchรฉ non produce un modello. รˆ un semplice algoritmo che memorizza tutti i casi disponibili e classifica le nuove istanze in base a una misura di similaritร .

Funziona molto bene quando c'รจ una distanza tra gli esempi. La velocitร  di apprendimento รจ lenta quando il set di addestramento รจ ampio e il calcolo della distanza non รจ banale.

Analisi delle componenti principali

Nel caso in cui si desideri uno spazio di dimensione superiore. รˆ necessario selezionare una base per tale spazio e solo i 200 punteggi piรน importanti di tale base. Questa base รจ nota come componente principale. Il sottoinsieme che si seleziona costituisce un nuovo spazio di piccole dimensioni rispetto allo spazio originale. Mantiene il piรน possibile la complessitร  dei dati.

Associazione

Le regole di associazione consentono di stabilire associazioni tra oggetti dati all'interno di database di grandi dimensioni. Questa tecnica non supervisionata riguarda la scoperta di relazioni interessanti tra variabili in database di grandi dimensioni. Ad esempio, le persone che acquistano una nuova casa hanno maggiori probabilitร  di acquistare nuovi mobili.

Altri esempi:

  • Un sottogruppo di pazienti affetti da cancro raggruppati in base alle misurazioni dell'espressione genica
  • Gruppi di acquirenti in base alla cronologia di navigazione e di acquisto
  • Gruppo di film in base alla valutazione data dagli spettatori del film

Apprendimento automatico supervisionato e non supervisionato

Ecco la differenza principale tra Apprendimento supervisionato e non supervisionato:

Scheda Sintetica Tecnica di machine learning supervisionata Tecnica di machine learning non supervisionata
Dati in ingresso Algorithms vengono addestrati utilizzando dati etichettati. Algorithms vengono utilizzati rispetto a dati non etichettati
Complessitร  computazionale Lโ€™apprendimento supervisionato รจ un metodo piรน semplice. L'apprendimento non supervisionato รจ computazionalmente complesso
Precisione Metodo estremamente accurato e affidabile. Less metodo accurato e affidabile.

Applicazioni dell'apprendimento automatico non supervisionato

Alcune applicazioni delle tecniche di apprendimento non supervisionato sono:

  • Clusterdividere automaticamente il set di dati in gruppi in base alle loro somiglianze
  • Il rilevamento delle anomalie puรฒ scoprire punti dati insoliti nel set di dati. รˆ utile per trovare transazioni fraudolente
  • L'estrazione associativa identifica insiemi di elementi che spesso si presentano insieme nel set di dati
  • I modelli a variabili latenti sono ampiamente utilizzati per la preelaborazione dei dati. Come ridurre il numero di funzionalitร  in un set di dati o scomporre il set di dati in piรน componenti

Svantaggi dell'apprendimento non supervisionato

  • Non รจ possibile ottenere informazioni precise sull'ordinamento dei dati e l'output in quanto i dati utilizzati nell'apprendimento non supervisionato sono etichettati e non conosciuti
  • Less l'accuratezza dei risultati รจ dovuta al fatto che i dati di input non sono noti e non sono etichettati in anticipo dalle persone. Ciรฒ significa che la macchina deve farlo da sola.
  • Le classi spettrali non sempre corrispondono alle classi informative.
  • L'utente deve dedicare tempo all'interpretazione e all'etichettatura delle classi che seguono tale classificazione.
  • Le proprietร  spettrali delle classi possono anche cambiare nel tempo, quindi non puoi avere le stesse informazioni sulla classe mentre ti sposti da un'immagine all'altra.

Sintesi

  • L'apprendimento non supervisionato รจ una tecnica di machine learning, in cui non รจ necessario supervisionare il modello.
  • L'apprendimento automatico non supervisionato ti aiuta a trovare tutti i tipi di modelli sconosciuti nei dati.
  • Clustering e associazione sono due tipi di apprendimento non supervisionato.
  • Quattro tipi di metodi di clustering sono 1) Esclusivo 2) Agglomerativo 3) Sovrapposto 4) Probabilistico.
  • I tipi di clustering piรน importanti sono: 1) Clustering gerarchico, 2) Clustering K-means, 3) K-NN, 4) Analisi delle componenti principali, 5) Decomposizione dei valori singolari, 6) Analisi delle componenti indipendenti.
  • Le regole di associazione consentono di stabilire associazioni tra oggetti dati all'interno di database di grandi dimensioni.
  • Nell'apprendimento supervisionato, Algorithms vengono addestrati utilizzando dati etichettati durante l'apprendimento non supervisionato Algorithms vengono utilizzati rispetto a dati non etichettati.
  • Il rilevamento delle anomalie puรฒ scoprire punti dati importanti nel tuo set di dati, utili per trovare transazioni fraudolente.
  • Il piรน grande svantaggio dellโ€™apprendimento non supervisionato รจ che non รจ possibile ottenere informazioni precise sullโ€™ordinamento dei dati.

Riassumi questo post con: