You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Einige Studierende haben berichtet, dass die Klassifikation der generierten Datenpunkte nicht ganz zur Aufgabe passt. Dort sollte eine Gerade durch den Datenraum gelegt werden und alle Punkte auf der einen Seite eine Klasse und die anderen die andere Klasse bekommen. Im Jupyter-Notebook scheint es dagegen immer Ausreisser zu geben?
@cyildiz Kannst Du bitte mal schauen, ob das wirklich ein Bug ist oder ob das so gewollt ist?
The text was updated successfully, but these errors were encountered:
Ja, das ist gewollt so und demonstirert folgenden Fall:
Die Daten (der Zusammenhang) ist vielleicht an sich linear, aber die Daten enthalten ein paar Ausreißer aufgrund von Noise. Der Gradientenabstieg ist weiterhin in der Lage, die optimale Lösung zu finden; nur das Minimum der Kostenfunktion ist in diesem Fall nicht gleich Null.
Die Frage zu der Training Accuracy deutet in diese Richtung.
Mit dem zusätzlichen Argument class_sep=1.5 könnte man den Abstand zwischen den zwei Daten-Clustern etwas erhöhen, sodass sie linear trennbar sind.
Die Studis waren etwas verwirrt, weil sie dachten, dass das Notebook ihnen die Daten erzeugt. Aber da das eine Aufgabe für die Studis war, hätten sie das noch selbst schreiben müssen.
Ich überlege, ob man noch eine Bemerkung auf das Übungsblatt schreiben sollte, weil die Rückfrage bisher in jeder Gruppe kam? Sonst kann hier zu.
Ganz unten am Ende der Frage ist im Moment folgender Hinweis vorhanden:
Sie können auch ... einen anderen Datensatz (z.B. zufällig generierter Datensatz mittels Numpy and Scikit-Learn) verwenden.
D.h. die Studierenden müssen den Datensatz nicht unbedingt manuell generieren (wie im ersten Punkt beschrieben), sondern können den Datensatz im Notebook verwenden oder mittels Scikit-Learn einen eigenen zufälligen Datensatz generieren.
Vielleicht sollte ich diesen Hinweis etwas ausbauen:
Sie können auch mittels Scikit-Learn einen eigenen zufälligen Datensatz generieren (ein Beispiel dazu finden Sie im Notebook).
Beachten Sie, dass die Daten in diesem Fall Rauschen (engl. Noise) enthalten können und der Datensatz möglicherweise nicht linear separierbar ist. Wie wirkt sich dies auf den Ablauf des Lernalgorithmus und die Ergebnisse aus?
@cyildiz Ich würde einfach nur in der Aufgabe, wo sie den Datensatz erzeugen sollen, noch einen Satz dazu schreiben: "Sie können auch mit dem Code in der Vorgabe (Jupyter-Notebook) die Daten erzeugen - diese sind aber mit Rauschen (engl. Noise) versehen und möglicherweise nicht linear separabel." ... Das sollte reichen.
Auf dem Blatt zur logistischen Regression gibt es als Vorgabe ein Jupyter-Notebook, welches die Studierenden verwenden können.
Einige Studierende haben berichtet, dass die Klassifikation der generierten Datenpunkte nicht ganz zur Aufgabe passt. Dort sollte eine Gerade durch den Datenraum gelegt werden und alle Punkte auf der einen Seite eine Klasse und die anderen die andere Klasse bekommen. Im Jupyter-Notebook scheint es dagegen immer Ausreisser zu geben?
@cyildiz Kannst Du bitte mal schauen, ob das wirklich ein Bug ist oder ob das so gewollt ist?
The text was updated successfully, but these errors were encountered: