Hallo zusammen,
Ich bin gerade völlig überwältigt von der KI und den Auswertemöglichkeiten, die es jetzt schon gibt. Ich bin auf https://julius.ai gestoßen und habe es mal ausprobiert.
Hier mein allererster Chat mit Julius.ai:
Kann Julius Massendaten auslesen und auswerten?
Daraufhin hat Julius die folgenden Python Code Zeilen erstellt und bei sich auf einer lokalen Instanz ausgeführt:
!pip install kaggle
!kaggle competitions download -c titanic
!wget https://raw.githubusercontent.com/datasciencedojo/datasets/master/titanic.csv
import pandas as pd
# Load the dataset
df = pd.read_csv('titanic.csv')
# Display the first few rows of the dataframe
df.head()
Als Ergebnis erhalte ich wie gewünscht den Datensatz der Passagierliste von der Titanik.
Das ist schon imponierend, dass die KI sich eigenständig über eine API an Kaggle andockt, und die Daten herunterlädt und darstellt:
Aber es kommt noch besser:
Das ist beeindruckend. Die Wahrscheinlichkeiten stimmen. Ich hatte sie erst letztens mit einem selbst erstellten Pythen Script erhalten.
Gleiches gilt für die Genauigkeit der Berechnung:
Hier der dazugehörige Code von Julius:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# Prepare the data
X = df[['Sex', 'Pclass']]
X = pd.get_dummies(X, drop_first=True)
y = df['Survived']
# Split the data into training and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Train a logistic regression model
model = LogisticRegression()
model.fit(X_train, y_train)
# Make predictions on the test set
y_pred = model.predict(X_test)
# Calculate the accuracy of the model
accuracy = accuracy_score(y_test, y_pred)
accuracy
Das eigentliche Deep Learning findet in der Bibliothek "LogisticRegression" statt. Dort werden mehrere Modelle an den Trainingsdaten ausprobiert und anhand der Testdaten die Vorhersagekraft überprüft. Das beste Modell gewinnt und hat in diesem Fall mit einer Wahrscheinlichkeit von 78% die Treffer vorhergesagt. Dies geht alles in Sekundenschnelle.
Kann Julius auch Hive?
So, schauen wir mal, was Julius noch so drauf hat:
Julius erstellt einen Code und versucht auf die Hive Blockchain zuzugreifen.
Aber das klappt nicht.
Also verbessert Julius seinen Code und versucht es noch mal:
Es klappt immer noch nicht, denn er möchte zu viele Daten abfragen. Daraufhin wird der Code noch mal angepasst und Tadaa, Julius kommt auf die Hive Blockchain und beantwortet meine Frage mit der Zahl 8
Stimmt denn diese Zahl?
Ja und nein.
Julius sieht meine Kommentare und einen Post.
Ich habe ihn nach den ersten 5 Wörtern im Body-Feld gefragt und hier ist die Auflistung:
Ja - ich bin baff. Diese Posts stammen alle von mir und wurden letztens getätigt.
Einen Post vermisse ich, aber das kann (muss) an den Details der Abfrage liegen, der Ball liegt also bei mir hier genauer zu fragen.
Julius kann auch Grafiken:
Auch das kommt hin. Wie gesagt vermisse ich einen Datensatz.
Am Limit
Als ich jedoch weiter forschen wollte, gab es dieses Popup:
Was auch verständlich ist, da ja doch einige Ressourcen gebraucht werden um das hier alles zu ermöglichen.
18 € im Monat finde ich durchaus erträglich. Sollte ich beruflich tatsächlich Große Datenmengen auswerten, werde ich das Geld sicherlich investieren.
Was bedeutet das?
Es bedeutet, dass die KI mittlerweile so weit fortgeschritten ist, dass sie Fragen so gut verstehen und beantworten kann, dass ein Großteil der Entwicklungsarbeiten (und damit auch der Entwickler) überflüssig geworden ist. Dieser hier dargestellter Usecase hätte für einen Durchschnittsprogrammierer mehrere Tage oder Wochen an Arbeit gekostet:
- Recherchieren: Wo gibt es die Daten
- Zugriffe und Schlüssel erstellen
- Code zur Auswertung schreiben
- Bibliotheken durchlesen, verstehen und anwenden
- Code zur Darstellung und Reporting erstellen
Ich habe diesen Chat innerhalb einer Stunde durchgeführt - und es war tatsächlich mein allererster Kontakt mit Julius.ai
Das Einzige was mich als Entwickler noch tröstet ist der Unterschied zwischen Theorie und Praxis. Denn wenn es an Spezialfälle geht und die funktionieren nicht, dann hilft es mir nur bedingt, wenn ich weiß, wie es eigentlich gehen sollte. Den Fehler muss ich immer noch selber suchen. Und dafür braucht es uns noch.
Gruß, Achim