21. Dezember 2016

Deep Learning – künstliche Intelligenz bringt derzeit einen riesen Fortschritt mit sich

Diese Methode dient zur Verarbeitung von Informationen, die vor allem aus großen Datensätzen gezogen werden, und erkennt Verbindungen zwischen den gewonnen unterschiedlichen Informationen.  Dazu werden mehrschichtige neuronale Netze, Deep Networks, herangezogen. Durch die tiefere Architektur werden Schicht für Schicht Informationen aus den Daten erlangt und dadurch eine einfachere und abstrakte Darstellung der Daten erzielt. Momentan werden Deep Networks hauptsächlich für die Bild- und Spracherkennung eingesetzt.

Im Gegensatz zu einem einfachen neuronalen Netzwerk besteht das Deep Network aus mehreren Schichten zwischen der Input- und Outputschicht, den sogenannten hidden Layers.

Jede hidden Layer wird einzeln, mit Hilfe üblicher Verfahren, wie beispielsweise Backpropagation, trainiert.  Die Inputschicht ist der Eingabevektor der ersten hidden Layer. Für die weiteren hidden Layers wird die Outputschicht der jeweils vorangegangenen hidden Layer als Eingabevektor verwendet. Die Outputschicht der letzten hidden Layer ist dann die des gesamten Deep Networks. Durch das separate Trainieren jeder einzelnen Schicht werden Probleme wie Vanishing Gradients und Overfitting vermieden.

Stacked Autoencoders, Deep Belief Networks (stacked Restricted Boltzman Machines) und Convolutional Networks sind die bekanntesten Beispiele für tiefe Netzwerke.

Abb.: Architektur des Deep Networks