00:00:00: Heute in der Folge geht es noch mal den letzten AI Agent, den ich gebaut
00:00:03: habe und die Erweiterung. Also ich habe noch ein paar Tools adaptiert an diesen Agents
00:00:07: selber. Ich will dir noch einen anderen zeigen, der sich gerade noch in dem Entwurfsstand
00:00:10: befindet, einfach dir ein bisschen das Gefühl zu geben, was mittlerweile möglich ist,
00:00:14: was mit diesen AI Agents machbar ist und ich habe noch ein kleines Beispiel
00:00:18: mitgebracht von einem Kundenprojekt, was letzte Woche, ja ich
00:00:21: würde mal sagen zu 95 Prozent abgeschlossen war. Wir sind jetzt
00:00:25: noch ein bisschen an ein paar Bugfixes dran, aber der erste Durchlauf ist
00:00:29: absolut vielversprechend und der kunde spart jetzt in einem vierstelligen
00:00:33: bereich jeden monat geld nur durch eine einzige
00:00:36: optimierung und ja wenn du wissen willst welche das war und was ich
00:00:40: vor allem jetzt hier aufgebaut habe und vor allem noch mehr wie du das
00:00:44: ganze vielleicht sogar in deinen alltag in deinen Business Alltag
00:00:47: integrieren kannst, dann bleibt dran, direkt nach dem Intro geht's los.
00:00:57: An der Stelle noch kurz, mein Name ist Felix Schmidt, Ich bin Maschinenbautechniker, habe
00:01:01: zehn Jahre Erfahrung im Maschinenbau, war in der Entwicklung tätig.
00:01:05: Bin seit 2022 im Marketing tätig und unterstütze jetzt mit
00:01:08: meinem eigenen Unternehmen Unternehmen im Bereich Handwerk, Maschinenbau,
00:01:12: Industrie, ihre Prozesse zu vereinfachen, mehr Kunden zu gewinnen durch
00:01:16: einfach eine erhöhte Sichtbarkeit, durch eine klare Kommunikation über
00:01:19: digitale Medien nach außen und wenn du mehr darüber wissen willst, welche
00:01:23: Prozesse ich hier durchführe, dann abonnier den Kanal, abonnier den Podcast, wo auch immer
00:01:26: du jetzt gerade zuhörst und gib den Videos, wenn auch immer du irgendwas hilfreiches
00:01:30: rausziehen konntest, ein Like, einen daumen nach oben und jetzt gehen wir weiter ins
00:01:34: thema wie eben angekündigt geht es heute noch mal diesen agent
00:01:37: und da habe ich dir noch mal die übersicht mitgebracht
00:01:41: ich hatte hier letztes mal ein agent aufgebaut der war
00:01:45: ein bisschen anders der hatte die tools direkt angebunden Also siehst
00:01:48: hier in dem Fall sind direkt die Tools angebunden
00:01:52: gewesen. Ich habe die noch hier unten drin gelassen für Kalender-Events,
00:01:56: für eine Notion-Datenbank und für eine E-Mail-Automatisierung.
00:02:00: Jetzt mittlerweile habe ich den Agent umgebaut und habe diesen
00:02:04: verschiedene Tools mitgegeben. Also verschiedene hier sieht man es schon
00:02:08: da ist ein Tool angebunden und dieses Tool ist quasi wieder ein
00:02:11: eigenständiger Agent der nur für eine bestimmte Aufgabe tätig ist. Ja fangen
00:02:15: wir aber vorne an damit das ganze so ein bisschen verständlich wird. Also wir starten
00:02:19: hier in dem Bereich von dem Trigger. Wir müssen hier mal gerade gucken. Also hier
00:02:23: ist der Trigger. Dann hier in dem Bereich haben wir den
00:02:26: Switch. Du
00:02:30: hast jetzt hier die Möglichkeit, dass du sagen kannst, okay,
00:02:34: kommt eine Voice Message rein oder kommt eine
00:02:38: Text Message rein. Also das ist ganz wichtig. Ich habe hier die Möglichkeit, in
00:02:41: Telegram einfach reinzusprechen und Telegram erkennt dann
00:02:45: automatisch oder die automatisierung erkennt dann automatisch. Handelt sich hier
00:02:49: im endeffekt eine voice message die erst noch transkribiert werden muss oder
00:02:52: handelt sich direkt einen eingegebenen text. Hintergrund ist der du bist vielleicht irgendwo
00:02:56: unterwegs du hast jetzt keine zeit unheimlich viel text da rein zu schreiben da ist
00:03:00: es in der regel einfacher du kannst das ganze aufnehmen sprichst es rein das
00:03:04: wird automatisch transkribiert und dann läuft das ganze
00:03:08: also du hast hier den workflow hier kommt das ganze an dann
00:03:12: läuft hierüber hier runter
00:03:16: läuft hier noch mal rein da holt er sich noch mal die ganzen Informationen und
00:03:20: dann geht es hier über diesen Pfad in den
00:03:23: Agent rein. Das ist wenn eine Voice Message kommt. Da gehen wir jetzt einfach mal
00:03:27: die einzelnen Punkte durch. Der Telegram Trigger, der zieht
00:03:30: sich jetzt erst mal eine Message. Wenn wir das ganze jetzt mal durchtesten, können wir
00:03:34: das einfach mal in dem Workflow ausprobieren. Wir gehen jetzt
00:03:38: hier mal auf Test. Also wir gehen jetzt hier oben, schalten wir
00:03:42: das ganze jetzt mal auf einen Live-Test.
00:03:46: Dann öffne ich mir die Telegram App und ziehe die mir hier
00:03:50: rüber. Und jetzt kann ich hier zum Beispiel sagen,
00:03:53: ja wir machen es direkt mit einer Voice Message. Welche Termine habe ich heute in
00:03:57: meinem Kalender? Jetzt können wir hier den Test-Workflow starten
00:04:01: bzw. Wir gehen jetzt hier rein und sagen test step
00:04:05: damit er nur den einen test zieht und jetzt sieht man hier in dem fall
00:04:08: ich mache gerade noch weil es ein bisschen stört hier den hintergrund weg
00:04:12: schuldigung in der stelle ob da ein neues videos setup da
00:04:16: muss ich mich erst mal ein wenig dran gewöhnen. Also hier hat man jetzt auf
00:04:19: jeden Fall den Text der reinkam.
00:04:23: Hier wird jetzt erkannt, es ist eine Audio Datei.
00:04:27: Von wem? Felix Schmidt, also der erkennt auch meinen Namen. Der erkennt vor allem eine
00:04:31: Message ID, die ist nachher wichtig, damit er das ganze speichern kann. Das sehen wir
00:04:34: aber jetzt im nächsten Schritt. Dann läuft das
00:04:37: ganze hier in den Bereich rein, in den Switch. Und da kommt jetzt,
00:04:42: wird jetzt quasi eine Wenn-Dann-Verknüpfung
00:04:46: aufgebaut. Also der guckt jetzt hier, existiert ein Text? Wenn
00:04:50: ja, dann gebe Text aus. Also der
00:04:53: exportiert jetzt erstmal nur einen Namen von der
00:04:57: sogenannten JSON, von dem JSON Code.
00:05:01: Kommt hier ein Bereich, ein Voice-File, also eine
00:05:04: MP3 rein, dann habe ich hier die Möglichkeit zu sagen Output Name
00:05:08: Voice und diese Output Names, da müssen wir gerade mal ein bisschen näher ran zoomen,
00:05:12: damit man das mal genau sieht, die siehst du jetzt hier in dem Fall. Jetzt
00:05:15: muss man gucken, ob wir hier treffen. Du hast jetzt hier den Fall,
00:05:18: dass dieser Switch quasi erstmal überprüft, was kommt für
00:05:22: eine Datei rein und entscheidet dann, okay es kommt ein Text raus
00:05:26: oder es kommt ein Voice, eine Voice Message raus. In
00:05:29: unserem Fall ist es eine Voice Message, das heißt wenn ich jetzt hier sage
00:05:34: Test Step, dann haben wir hier,
00:05:38: wie man hier sieht, hier habe ich jetzt die Output Bereiche
00:05:42: und ich habe jetzt hier ein Text Output und ein Voice Output und hier in
00:05:45: dem fall ist jetzt quasi ein voice output rausgegangen. Hier ist jetzt noch nichts mit
00:05:48: der datei passiert, die ist noch nicht transkribiert worden. Ist
00:05:52: jetzt alles quasi so wie es ja wie es reingekommen
00:05:56: ist. Jetzt geht es hier den pfad weiter. Wir gehen in den
00:05:59: bereich der Telegram App noch mal rein. Diese Telegram
00:06:03: App zieht sich jetzt noch mal die Datei. Also hier sieht man jetzt, der zieht
00:06:07: sich jetzt die File ID bzw. Die
00:06:10: Datei, die MP3 mit der Funktion Get und
00:06:14: referenziert diese ID über die letzten Knoten. Du
00:06:18: hast halt immer die Möglichkeit, wenn du das Schritt für Schritt durchspielst, dass du die
00:06:22: davorherigen Knoten quasi auswählen kannst. Und jetzt hier in dem Falle
00:06:26: kannst du hier auf Schema gehen und wenn man jetzt hier durch scrollt,
00:06:29: sieht man hier, da ist die File-ID und du hast jetzt hier die
00:06:33: Möglichkeit ich kann das ganze einfach jetzt mal rausschmeißen.
00:06:37: So jetzt ist das ganze hier leer und jetzt kannst du hier die File-ID einfach
00:06:40: nehmen und per drag and drop da reinziehen und dann hast du automatisch
00:06:44: hier diese id die wir vorher referenziert haben und
00:06:48: das ganze findest du jetzt auch noch mal hier unter dem bereich also hier unten
00:06:51: wird quasi noch mal die file id gezogen und da
00:06:55: so hast du es halt ohne dass du irgendwie coden musst oder irgendwelche
00:06:59: code schnipsel schreiben musst kannst du quasi hier einfach
00:07:02: deine ja kannst du hier einfach die teile die du
00:07:06: referenzieren willst per track and drop reinziehen Das kannst du aus jedem Bereich machen, ob
00:07:10: es aus der Tabelle ist, aus dem JSON-Bereich. Du kannst überall einfach hier die
00:07:13: Elemente packen und ziehst sie dir rein und wenn du diesen vorherigen
00:07:17: Trigger schon ausgelöst hast, zeigt er dir unten drunter auch die referenzierte
00:07:21: ID an, in dem Falle den Inhalt, der halt quasi dahinter steht.
00:07:25: So das ganze funktioniert, dann gehen wir hier auf Test Step und jetzt sehen wir
00:07:29: hier im Output Bereich, dass der hier, jetzt müssen wir mal gucken, ob wir auf
00:07:32: der richtigen Ecke unterwegs sind, hier zieht er sich jetzt quasi
00:07:37: die datei jetzt siehst du da ist ein binary aufgetaucht also
00:07:41: hier unten in dem bereich ist jetzt steht binary das
00:07:44: steht jetzt dafür Daten
00:07:48: egal ob es jetzt mp3 Daten, pdf Daten oder sonst irgendwas sind, dann
00:07:51: erscheint immer dieser zusätzliche binary Bereich, weil die halt über dieses
00:07:55: Format weitergegeben werden. Und da hast du jetzt die Möglichkeit wirklich zu
00:07:59: sagen, okay darauf greifen wir jetzt zu in dem nächsten
00:08:03: knoten jetzt sieht man hier wieder ganz schön da ist ein item weitergegeben worden
00:08:06: und das wird jetzt übertragen also die mp3 geht jetzt in
00:08:10: dem step rüber in den openai agent
00:08:14: entschuldigung ist gar kein agent in die openai schnittstelle
00:08:18: die ist wiederum mit meinem ja mit meiner
00:08:22: api verbunden also wenn du da mal irgendwie vielleicht mache ich mal ein extra Video,
00:08:25: wo es halt hier die APIs geht, weil ich finde, ja das ist relativ gut
00:08:29: dokumentiert, wenn du hier eine neue API anbinden willst, das ist also kein
00:08:33: Hexenwerk, dann gehst du einfach hier auf Create New
00:08:36: Credential und dann wirst du in dem Fall bei
00:08:40: einer OpenAI API nur noch dem Key gefragt. Also wenn
00:08:44: du ein OpenAI Account hast und hast die Möglichkeit auf deine APIs zuzugreifen,
00:08:47: kopierst du dir einfach rein, drückst auf verbinden und dann ist eigentlich schon
00:08:51: alles fertig. Jetzt wählst du hier in dem Falle aus
00:08:55: Audio, also du hast hier die Möglichkeit auf einen Textbot zu gehen, auf
00:08:58: ein Assistant zu gehen, den du dir vielleicht im Hintergrund aufgebaut hast. Du
00:09:02: willst vielleicht ein Bild generieren, dann musst du hier auf Image gehen und kannst dann
00:09:06: das Modell auswählen. Wir wollen aber jetzt hier in dem Fall eine Audiodatei transkribieren,
00:09:10: also wählen wir hier Audio aus und hier hast du jetzt die Operation
00:09:13: oder die Operation, die mit diesem Audio-File
00:09:17: passieren soll. Und da ist jetzt in dem falle
00:09:21: transcribe recording. Wir könnten das auch übersetzen
00:09:25: also wenn du jetzt sagen willst okay du hast eine audio datei in deutsch
00:09:28: aufgenommen willst sie direkt in dem step in englisch übersetzen dann könntest du das hier
00:09:32: mitmachen generate audio da kannst du halt ein
00:09:35: audio direkt von einem text prompt generieren lassen
00:09:39: aber wir in dem falle nutzen jetzt trans greif
00:09:42: recording und hier input data field name ist einfach nur data Das
00:09:46: ist quasi als fix hier reingeschrieben. Da brauchen wir keine Formel für, weil du siehst
00:09:50: hier in dem Bereich hier neben, da findest du den Punkt Data. Jetzt müssen wir
00:09:54: mal gucken, ob wir hier in der richtigen Ecke sind. Hier findest du den Bereich
00:09:57: Data und deswegen können wir das
00:10:01: jetzt da reinziehen und können sagen ok test step und lassen das ganze mal
00:10:05: durchlaufen und wenn man sich vielleicht noch erinnert ist jetzt ein paar minuten her
00:10:08: haben wir hier welche termine habe ich heute in meinem kalender
00:10:12: hat also wunderbar funktioniert und dieser input
00:10:16: geht jetzt quasi direkt rüber in den agent.
00:10:21: So was macht jetzt dieser agent? Gehen wir mal da rein.
00:10:25: Dieser agent hat jetzt den hintergrund, das habe ich in dem letzten video schon mal
00:10:28: grob erklärt, dass der automatisiert
00:10:33: auf basis natürlich einer anweisung die du ihm vorgibst
00:10:36: bestimmte handlungen ausführt das können handlungen sein dass er einfach nur eine
00:10:40: recherche reingeht also du kannst einen ganz einfachen agent aufbauen indem du
00:10:44: lediglich sagst wir können das ja hier mal gerade in einem Beispiel einfach hier neben
00:10:47: machen. Du sagst jetzt hier, du hast
00:10:50: einen Agent, gehst hier auf Advanced AI
00:10:54: und dann auf AI Agent und dann hast du hier entweder einen Tools
00:10:58: Agent, den nutze ich aktuell oder du kannst auch ein conversational agent nehmen,
00:11:02: der ist halt mehr so für eine, ja wenn er nur Konversationen
00:11:06: führt mit dir, aber nicht jetzt irgendwelche anderen Dateien
00:11:10: anpackt. Es gibt hier alles mögliche, also in
00:11:13: den meisten Fällen wirst du wahrscheinlich diesen Tools Agent nehmen und dann kannst du
00:11:17: hier sagen eigentlich in der Regel auch immer define below, also du
00:11:21: gibst dem jetzt hier vor was dieser Agent machen soll.
00:11:25: Dann braucht der Agent in ja ich würde sagen 95 Prozent aller
00:11:29: Fälle immer eine System Message, die du dem vorgibst, damit er genau weiß
00:11:33: wie er handhaben muss weil ganz so viel magie ist es dann doch
00:11:36: nicht also du musst ihm schon ganz präzise sagen was er für
00:11:40: aufgaben erfüllen soll und was er für aufgaben eben auch nicht erfüllen
00:11:44: soll und dann hast du hier im endeffekt quasi deinen agent wir können mal
00:11:47: gerade rausgehen der sitzt jetzt hier hinter hat sich schon angeknüpft
00:11:51: und jetzt sieht man hier noch ganz schön dass der ein
00:11:56: rotes dreieck hat mit einem ausrufezeichen drin also dem fehlt
00:11:59: noch irgendwas ein agent benötigt immer ein
00:12:03: chatmodel und da hast du dann die möglichkeit unterschiedliche modelle anzuwählen. Du siehst
00:12:07: hier in der liste, ich muss mal gerade mein bild ein bisschen wegziehen,
00:12:12: das war das falsche bild, muss mal gerade mein bild ein bisschen wegziehen.
00:12:15: Du siehst hier in der liste auf jeden fall ganz viele verschiedene modelle. Hier deep
00:12:19: seek ist mit drin, dann croc
00:12:23: von von ja hier ist es vom elon musk ist
00:12:27: da drin. Olama ist
00:12:31: quasi eine anbindung wo du verschiedene andere Tools quasi
00:12:34: lokal einbinden kannst. Also wenn es jetzt sensible Daten geht, die jetzt nicht unbedingt
00:12:38: mit dem World Wide Web geteilt werden sollen, dann kannst du hier
00:12:42: mit dem Tool Olama die Sprachmodelle
00:12:45: lokal bei dir installieren, entweder auf dem Server oder bei dir auf dem PC
00:12:49: und kannst damit chatten. Die Reaktionszeit geht dann ein bisschen nach oben, also es dauert
00:12:53: in der Regel länger, aber du hast die Möglichkeit hier wirklich dann, dass die Daten
00:12:57: bei dir bleiben und nicht irgendwie mit der Außenwelt geteilt
00:13:01: werden. In unserem Fall haben wir jetzt einfach OpenAI Chatmodel
00:13:04: genommen. Das binde ich hier an. Dann fragt er mich hier in dem Falle wieder,
00:13:08: welchen Account will ich nehmen. Wir lassen das jetzt hier auf dem Zweier stehen und
00:13:11: dann hast du die Möglichkeit aus der Liste, wie hier, quasi die
00:13:14: ganzen Chatmodelle auszuwählen, die aktuell in
00:13:18: dem Stand hier verfügbar sind. Jetzt sieht man, aktuell gibt es ja schon das
00:13:22: O3 Mini, dann O3 Mini Lite
00:13:26: oder so irgendwas. Ich weiß gar nicht auswendig wie die heißen. Die sind jetzt hier
00:13:30: aktuell noch nicht drin und wenn du jetzt sagst du hast keine komplizierten
00:13:33: aufgaben der soll jetzt nicht irgendwelche blog artikel oder wissenschaftliche arbeiten
00:13:37: schreiben dann kannst du ja einfach getrost auf 4o mini gehen
00:13:41: weil das ist aktuell relativ kostengünstig
00:13:45: und ja du darfst nicht vergessen alle anfragen die du
00:13:49: rausschickst über die api werden im endeffekt
00:13:52: auch berechnet und da hatten wir auch in dem kundenprojekt wo ich
00:13:56: nachher noch kurz darauf eingehe hatten wir den fall dass wir halt alleine in
00:14:00: der testphase weil wir 4 genommen haben, relativ schnell dann
00:14:03: für 100 Durchläufe, wo E-Mails quasi, also
00:14:07: bestimmte E-Mails die aus einem Operations- oder aus
00:14:13: einem Prozessmanagement-Tool rauskamen, die haben wir verarbeitet,
00:14:17: haben die übertragen in ein JSON-File und haben die dann wieder übertragen in eine
00:14:21: Datenbank, wo die kompletten Projekte dann drin verwaltet wurden. Und da waren
00:14:24: halt ruck zuck dann nach dem Test von irgendwie 150 E-Mails waren dann 14
00:14:28: Euro weg. Ist immer noch günstiger, als wenn es einer händisch gemacht hätte, aber man
00:14:32: sollte es halt nicht aus dem auge verlieren weil es kann auch ruck zuck wie
00:14:35: nach dem was du da machst kannst halt relativ teuer werden deswegen macht es sinn
00:14:39: auf jeden fall immer mit den günstigen modellen zu starten und wenn die die
00:14:43: aufgabe wunderbar erfüllen dann lässt man es dabei und wenn da irgendwo eine grenze erreicht
00:14:46: wird dann kann man immer noch überlegen ob man bestimmte aufgaben durch etwas teurere
00:14:50: modelle dann ersetzt jetzt hast du hier den fall dass
00:14:54: du einen memory hinzufügen kannst den habe ich jetzt hier wie man
00:14:57: hier sieht in meinem agent ich ziehe mal mein bild wieder ein bisschen hierüber so
00:15:01: da wo es war hier in dem agent siehst du auch dass ich ein
00:15:04: memory eingebaut habe und dieser memory bereich der
00:15:08: speichert sich quasi meine nachrichten die eingegangen sind und das hat
00:15:12: einfach den hintergrund wenn du das nicht machen würdest
00:15:15: dann könntest du nicht mit diesem Agent in Interaktion treten. Also er gibt dir
00:15:19: irgendeinen Output raus und dann sagst du ja okay das passt jetzt noch nicht ganz,
00:15:23: da habe ich mir ein anderes Ergebnis gewünscht. Wenn du keinen Memory Speicher da
00:15:26: drin hast, der sich wirklich merken würde die letzten 4, 5,
00:15:30: 6 nachrichten, dann würde der immer wieder von vorne
00:15:34: anfangen. Deswegen ist es halt gerade bei so Konversationen, die du
00:15:37: führst, unheimlich wichtig, einen Memory Bereich einzubauen. Der ist auch hier
00:15:41: integriert, da brauchst du gar nicht, ist keine Raketenwissenschaft, klickst einfach hier
00:15:45: drauf, Window Buffer oder Window Buffer Memory,
00:15:48: kannst den dann noch benennen und kannst hier dann in dem Fall auch wieder
00:15:52: sagen Define Below. Hier können wir jetzt nichts auswählen, weil wir
00:15:56: nichts angeknüpft haben, aber ich zeige es dir einfach mal gerade in dem anderen Bereich.
00:15:59: Hier siehst du halt noch, aktuell merkt er sich die
00:16:02: letzten fünf konversationen wir gucken uns das ganze jetzt aber mal
00:16:06: hier an wie ich es hier eingebunden habe du
00:16:10: hast jetzt hier den key und das ist wenn man jetzt hier mal guckt dass
00:16:13: es telegram trigger darauf greift er zu dann über item.json.message.chatid
00:16:19: zieht er sich die Chat ID raus und die ist halt wichtig, dass er sich
00:16:22: darauf immer wieder referenzieren kann und weiß, okay ich muss mir immer wie in diesem
00:16:26: Fall die letzten fünf Nachrichten abspeichern.
00:16:30: Dann hast du jetzt hier jetzt würde so der agent könnte
00:16:34: so schon funktionieren also der braucht jetzt einen eingang der braucht
00:16:38: diese beiden bereiche und dann bräuchte der noch ein output aber der bräuchte
00:16:42: nicht mit aller gewalt ein tool sondern es würde auch
00:16:46: ohne ein Tool funktionieren. Wenn man jetzt hier sagt, okay da kommt jetzt noch ein
00:16:49: Eingang rein. Keine Ahnung wir nehmen einfach mal,
00:16:54: ziehen den einfach mal darüber. Geht ja relativ gut. So dann können
00:16:58: wir dem jetzt hier sagen, okay define below jetzt war
00:17:02: der noch rot. Bitte beantworte
00:17:11: die die frage des benutzer.
00:17:15: So you are helpful assistant hier können wir jetzt reinschreiben
00:17:19: du beant
00:17:24: jetzt gucken wir mal gerade sie jetzt sieht man hier jetzt ist alles weg was
00:17:28: irgendwie zu einem fehler geführt hätte und jetzt habe ich hier die möglichkeit zu sagen
00:17:32: ok test step jetzt hat er hier natürlich
00:17:36: den noch mal fehler gebracht weil der window buffer memory in dem falle nicht
00:17:39: richtig konfiguriert war jetzt würde ich dem hier quasi
00:17:43: einfach diesen key einfach mal mitgeben oder wir können es auch mal
00:17:47: selber aufbauen also wir brauchen hier den key jetzt gehen wir hier in dem
00:17:50: falle auf expression also auf formel und haben jetzt hier die möglichkeit
00:17:54: über die geschweifte klammer einfach die
00:17:58: bei mac ist es option 8 da kann man das eintragen und jetzt
00:18:01: habe ich hier die möglichkeit dann geht er automatisch in diesen code bereich rein und
00:18:05: jetzt kann ich hier gucken ok der soll das aus dem telegram trigger ziehen also
00:18:09: aus dem ersten note dann gehe ich auf punkt dann
00:18:12: schlägt er mir item vor jetzt sieht man hier alles was da irgendwie reinkommt
00:18:16: aber wir wollen ja nur die chat id haben dann gehen wir auf jason sieht
00:18:20: man immer noch das ganze und jetzt kann man hier auf Message
00:18:23: gehen, Chat-ID.
00:18:28: Jetzt sehen wir hier, da ist wieder die ID drin, wie im
00:18:31: letzten knoten und jetzt sollte auch hier in dem falle der fehler weg sein wenn
00:18:35: wir hier auf test step gehen und jetzt sehen wir hier ok der
00:18:39: zieht das ganze jetzt daraus hier sieht man hier neben so ein bisschen den
00:18:43: chat ich hoffe man kann es einigermaßen sehen ich ziehe das fenster rüber bitte beantwortet
00:18:47: die frage des benutzer system message das zieht er mit rein
00:18:53: und gucken jetzt mal hier was gerne was ist die Frage. Also hier kommt
00:18:56: jetzt die Frage, weil er das wahrscheinlich nicht richtig übernommen hat aus
00:19:00: dem Bereich. Jetzt müssen wir gerade mal gucken was da an input reingekommen
00:19:04: welche termine habe ich heute in meinem kalender also man sieht jetzt hier der
00:19:08: hat den input schon genommen beantworte die frage
00:19:11: des benutzers hier ist jetzt der fehler
00:19:16: Hier müsste ich jetzt zum Beispiel sagen,
00:19:19: ich müsste hier den Text reinziehen, weil er jetzt hier nicht wusste, was die Frage
00:19:23: ist. Wenn wir jetzt noch mal auf Test Step gehen, sollte er hier, es tut
00:19:26: mir leid, aber ich habe keinen Zugriff auf deinen Kalender oder persönliche Daten. Du kannst
00:19:29: jedoch einfach deine Kalender App öffnen, deine Termine für heute zu
00:19:33: prüfen. Brauchst du Hilfe bei etwas anderem? So
00:19:37: jetzt haben wir natürlich hier den Fall, dieser Agent hat jetzt nur
00:19:41: Zugriff auf das Chat Modell, der Zugriff auf die letzten Nachrichten,
00:19:45: aber er hat jetzt keinen zugriff auf das kalender modell oder auf das kalender tool
00:19:49: und genau deswegen haben wir jetzt hier den punkt dass dieser agent diese aufgabe
00:19:53: nicht erfüllen kann aber du könntest jetzt hier zum beispiel sagen was
00:19:56: ist keine ahnung 25 plus 5
00:20:01: also alles was wofür der agent jetzt keine exorbitant großen tools braucht
00:20:05: kannst du jetzt hier hinzufügen könnte es jetzt hier zum beispiel auch sagen
00:20:09: hier gibt es auch calculator wenn du jetzt irgendwas berechnen musst könntest du jetzt
00:20:12: hier ein taschenrechner hinzufügen und dann würde er
00:20:16: als tool auf diesen taschenrechner hin zugreifen wenn du jetzt
00:20:20: sagen würdest okay was ist 3 plus 5 wir können das ganze
00:20:24: einfach noch mal testen in dem falle machen das ganze jetzt
00:20:27: einfach noch mal auf test workflow was ist 3
00:20:31: plus 5 minus 7 ziehen wir uns das ganze mal hier
00:20:35: rüber jetzt hat er wieder ein audio file hat er erkannt
00:20:39: hier hat er es wieder rüber gezogen
00:20:44: hier hat er die datei runtergeladen in dem falle sollte jetzt das
00:20:47: transcript erstellt werden. Was ist 3 plus 5 minus 7? Okay
00:20:51: das hat er schon mal erkannt und jetzt gehen wir mal hier in
00:20:55: den agent rein und gucken ob er das mit dem kalkulator macht. Ich versuche es
00:20:58: mal hier über das play zu machen, damit man sieht was hier im hintergrund passiert.
00:21:03: So 3 plus 5 sind
00:21:06: 8 minus 7 müsste jetzt 1 rauskommen deswegen bin ich mal gespannt.
00:21:11: 3 plus 5 minus 7 ergibt 1. Also man sieht jetzt
00:21:14: hier der hat sich die nachricht gezogen. In diesem bereich hat er das ganze
00:21:18: jetzt in eine aufgabe für den agent umgewandelt also das chat modell ist quasi
00:21:22: immer dafür da dass eine aufgabe erstellt werden kann wie
00:21:26: der agent löst der hat sich hier noch mal auf die nachricht bezogen
00:21:30: hat die hier reingezogen und hier sieht man immer wenn man ein bisschen näher heran
00:21:33: zoomt in dem fall jetzt ist mein stift weg den ich eigentlich nehmen wollte so
00:21:36: hier sieht man jetzt immer in dem falle der
00:21:40: zieht hat zwei durchläufe hier drin gehabt
00:21:43: hier hat er auch noch ein durchlauf gehabt den ich jetzt ein bisschen wo ich
00:21:46: leider ein bisschen daneben gemalt habe hier hat er einen durchlauf gehabt und
00:21:50: wenn man jetzt hier in den kalkulator mal reingeht also man hat auch immer die
00:21:53: möglichkeit jetzt doppelklick auf die datei zu machen hier hat er jetzt die
00:21:57: anfrage schon umgewandelt in 3 plus 5
00:22:01: minus 7 also er hat schon mal die gesprochenen also die
00:22:04: texte quasi umgewandelt in rechenformate rechenzeichen und hat hier
00:22:08: das ergebnis 1 ausgegeben und das gibt er jetzt wieder
00:22:12: zurück und der agent wandelt das dann in eine klare
00:22:15: antwort dass er hier zum beispiel sagt 3 plus 5 minus 7 ergibt 1
00:22:19: und das schöne hier dran ist jetzt dass der agent von alleine
00:22:23: erkannt hat was für eine aufgabe muss ich erfüllen
00:22:27: wählt dann das entsprechende tool aus was ihm zur verfügung gestellt
00:22:31: wird sofern es halt da ist dieses tool dann zu nutzen die
00:22:35: aufgabe zu erfüllen und wenn man jetzt hier wenn du n8n
00:22:38: zum beispiel in dem fall ist das automatisierung tool wenn du es dir in der
00:22:41: freien version runterlässt und guckst dir einfach mal an was für tools du mittlerweile
00:22:45: hier anbinden kannst du kannst vector datenbank anbinden
00:22:50: Also ich habe noch gar nicht alle Tools hier durchgeguckt. Airtable, wenn du Airtable zum
00:22:54: Beispiel nutzt, machen relativ viele. Ich nutze jetzt in meinem Fall Notion, aber
00:22:57: auch Notion kannst du anbinden. Du kannst auf AWS
00:23:01: zugreifen. Also alles was jetzt hier irgendwie so mit Daten und Datenmanagement zu
00:23:05: tun hat, ist hier drin. ClickUp kannst du verwenden,
00:23:09: wird der ein oder andere vielleicht kennen. Und du hast wirklich
00:23:12: unfassbar, hier DEEPL, also wenn du irgendwas quasi übersetzen
00:23:16: musst oder du willst irgendwas schreiben hier ist jetzt in dem falle die be translate
00:23:20: data using die bel dll tun weiß ich jetzt gar nicht was man
00:23:23: damit kannst wahrscheinlich post automatisierung dann direkt machen also du
00:23:27: hast unzählige tools und da macht es wirklich einfach mal sinn sich das ganze mal
00:23:31: anzuschauen und da mal rein zu gucken und mit dem blick auf die uhr
00:23:34: und einer knappen halben stunde würde ich sagen ich habe dir jetzt wahrscheinlich an dem
00:23:38: einfachen beispiel relativ gut erklärt wie so ein agent
00:23:42: funktioniert was dieser machen kann Und jetzt in
00:23:45: meinem Fall habe ich halt hier gesagt, okay, ich gebe ihm Tools
00:23:49: mit an die Hand. Hier wäre jetzt ein Kalender-Tool.
00:23:53: Dann hätte ich hier ein Kontakt-Daten-Tool, was halt auf meine Kontaktdaten
00:23:57: zugreift. Wenn ich jetzt eine E-Mail schreiben will, beispielsweise,
00:24:01: ich transkribiere irgendwas und sage, schreib mir bitte eine E-Mail an
00:24:05: xyz mit dem und dem hin inhalt dann würde
00:24:08: dieses dieser agent automatisiert die email
00:24:12: adresse raussuchen die er dann in dem nächsten agent der die email adresse dann ver
00:24:15: oder die email dann verfasst dieser hat dann meinen schreibstil
00:24:19: angelernt also der nutzt mein transkript nutzt dann meinen angelernten
00:24:23: Schreibstil, daraus direkt eine vernünftige E-Mail zu formulieren. Da ist meine
00:24:27: Signatur drin. Dann habe ich hier einen
00:24:31: Task Manager Agent. Dieser Task Manager Agent, der sagt mir zum
00:24:34: Beispiel, da könnte ich jetzt neue Aufgaben anlegen. Wenn ich jetzt eine E-Mail
00:24:38: bekommen habe, beispielsweise, die automatisch in eine Aufgabe
00:24:42: überführt werden soll, dann könnte ich das entweder so einbinden, dass das
00:24:45: automatisiert passiert, oder ich könnte es so einbinden, dass ich zum Beispiel eine
00:24:49: Sprachnachricht mache und sage, lege mir eine Aufgabe in meiner Aufgabendatenbank
00:24:53: an mit dem Titel XYZ und der
00:24:57: Fälligkeit übermorgen und dann keine
00:25:00: Ahnung noch einen Betreff beispielsweise, wenn ich es nachher per e-mail versenden
00:25:04: will also so wie ich meine aufgabendaten waren quasi ja
00:25:08: aufgebaut habe und hier im letzten fall haben wir noch den
00:25:11: e-mail agent der halt dafür sorgt dass ich halt e-mails versenden kann
00:25:15: meeting anfragen versenden kann und hinter diesen
00:25:19: tools stecken immer ja unterschiedliche agents
00:25:23: wir können es hier das ganze mal anmachen hier wäre zum beispiel der task agent
00:25:26: der ist auch inaktiv weil die tools die quasi aufgerufen werden
00:25:30: die müssen nicht aktiviert werden weil in dem Falle
00:25:34: sieht man hier die werden gesteuert über einen externen Trigger
00:25:37: Workflow Input Trigger und das ist quasi genau
00:25:41: der hier. Jetzt haben wir hier den Task Manager. Der bekommt
00:25:45: eine kurze Beschreibung mit. Können wir auch das ganze mal aufmachen. Du bist für die
00:25:48: Aufgabenverwaltung zuständig und kümmerst dich anfragen zu laufenden Aufgaben
00:25:52: oder erstellst neue auf anfragen neue Aufgaben
00:25:56: in dem du die relevanten Punkte vom User abfragst.
00:26:01: Das ganze geht dann an also der greift auf eine
00:26:04: datenbank zu auf eine datenbank von meinen agents quasi und
00:26:08: dann kann ich die hier auswählen jetzt habe ich hier den fcm task agent ausgewählt
00:26:12: hier sieht man den oben fcm task agent das heißt sobald
00:26:16: eine Anfrage von diesem hier an den Task Agent
00:26:19: geht, wird die komplette Anfrage überführt, kommt hier rein
00:26:23: und geht hier in den nächsten Agent rein. Und dieser Agent ist jetzt ganz
00:26:27: spezialisiert nur auf meine Aufgabendatenbank
00:26:31: oder nur für meine Aufgaben in der Aufgaben Datenbank verantwortlich und das ist
00:26:35: das schöne, weshalb du nahezu unendlich große Systeme hier aufbauen
00:26:38: kannst, weil du einfach deine Aufgaben runter brichst
00:26:43: in einzelne Schritte, die nacheinander und in gewissen
00:26:46: reihenfolgen abgearbeitet werden müssen das gibt dir halt die unfassbare möglichkeit
00:26:50: zu sagen du hast für jede aufgabe
00:26:54: einen eigenen agent der ganz konzentriert
00:26:57: experte in diesem einen bereich ist und er muss auch gar nichts anderes können und
00:27:01: das gibt es zudem auch genauso vor. Also du konfigurierst quasi
00:27:04: die Grenzen, die dieser Agent hat und hast so die
00:27:08: Möglichkeit, dass du die Aufgaben ganz spezifisch aufbauen,
00:27:12: aufsetzen kannst, ohne dass irgendwas anderes noch mit
00:27:16: dabei gemischt wird und so hast du halt wirklich die möglichkeit wenn du das ganze
00:27:19: ins feintuning rein feintuning reinbringst dass so ein
00:27:23: agent wirklich komplette aufgaben von dir eigenständig
00:27:26: erledigen kann mit einem einzigen trigger den du dir
00:27:30: mit gibst und das muss nicht mal in dem Falle wie hier eine Nachricht
00:27:34: sein, das kann auch ein Datei-Upload sein. Also du hast ein Onboarding mit
00:27:38: einem Kunden beispielsweise, ihr habt das ganze in Teams gemacht,
00:27:41: habt dann Transkript automatisch in Teams anlegen lassen,
00:27:45: dann könntest du dieses Transkript, die Audiodatei in den Ordner speichern
00:27:49: und sobald da eine Datei in dem Ordner landet, läuft diese
00:27:52: Automatisierung los und weiß ganz genau, wenn in dem Ort eine Datei auftaucht,
00:27:56: dann habe ich ein Onboarding hinter mich gebracht und dann läuft ein Prozess ab.
00:28:00: Dann kannst du die einzelnen Schritte rausziehen, du kannst schon mal die einzelnen,
00:28:04: keine Ahnung, wenn es darum geht, neue Teile für einen Kunden zu
00:28:08: fertigen oder so, dann kannst du auf Basis von dem Transkript dir
00:28:12: schon mal Aufgaben erstellen lassen in einem Board, die nacheinander
00:28:15: abgearbeitet werden müssen. Und so all das, was du quasi
00:28:19: händisch machen musst, läuft dann in einem Automatisierungsschritt ab. Und
00:28:22: jetzt noch ganz kurz zu dem fall der kunde der hatte ein
00:28:26: thema der hatten also da gibt es auch noch eine folge mit dem kunden zu
00:28:30: aber jetzt schon mal so als kleinen Ausblick. Der hatte ein Datenverwaltungstool
00:28:34: oder so ein Projekttool, ein internes, was keine guten
00:28:37: Schnittstellen zu externen Tools hat. Das ist eigentlich immer so das große Problem,
00:28:41: wenn du Tools einsetzt, die keine Schnittstelle zu anderen
00:28:45: zu anderen Programmen hat. In dem Fall war es so, also mussten wir
00:28:49: über den Weg E-Mail gehen. Das Programm konnte E-Mails versenden und wir haben quasi ein
00:28:53: E-Mail Template aufgebaut, was immer die gleiche Struktur hat. Wo eine
00:28:56: Auftragsnummer, ja wenn vorhanden Kundendaten,
00:29:00: aber in der regel waren es halt kunden nummern die wurden rausgegeben
00:29:04: dann wurde dieser kunden nummer waren dann aufträge
00:29:08: zugeordnet die erledigt werden müssen also es gab verschiedene parameter die
00:29:11: immer in einer e-mail rausgegeben wurden und das war sozusagen
00:29:15: der trigger Diese E-Mail ging immer an eine einzige E-Mail Adresse, die wir dafür
00:29:19: angelegt haben und sobald eine E-Mail reinkam, wurde die quasi
00:29:23: geöffnet, ausgelesen und an den Agent übertragen und
00:29:27: dann hat dieser Agent quasi erstmal überprüft, welcher Inhalt steht da
00:29:30: drin und auf Basis von der Auftragsnummer wurde eine
00:29:34: Projektdatenbank nach der Auftragsnummer durchsucht. Wenn
00:29:38: diese existierte, wurde geguckt, hat sich der Status
00:29:41: geändert, sind irgendwelche Informationen dazu gekommen. Dann wurde quasi ein
00:29:45: update dieser aufgabe in der datenbank vorgenommen wenn diese
00:29:48: auftragsnummer noch nicht existierte wurde in der datenbank eine neue
00:29:52: aufgabe angelegt und die kompletten inhalte der e-mail wurden dann in diese
00:29:56: datenbank übertragen und das hatte halt den vorteil dass im
00:29:59: vorfeld haben ja hat der kunde sich jeden tag
00:30:03: mit seinen mitarbeitern zusammengesetzt das kann man eine halbe stunde gewesen sein mal eine
00:30:07: dreiviertel stunde aber jeden tag und ist in diesem projekt
00:30:10: verwaltungstool alle aufgaben durchgegangen
00:30:14: hat die übertragen in excel sheet in dem excel sheet
00:30:18: wurden dann mitarbeiter zugegeben zugewiesen die hat gesagt haben
00:30:21: okay der Mitarbeiter ist für das zuständig und das wurde alles aus dem
00:30:25: Programm händisch übertragen, weil wir auch keine Möglichkeit hatten, diese Daten automatisiert
00:30:29: an das nächste Tool zu übergeben. Und jetzt haben wir den Fall,
00:30:33: die E-Mail kommt rein. Also wenn irgendwo in dem kompletten
00:30:36: Betrieb in diesem Projektverwaltungstool irgendwas auf
00:30:40: den nächsten Status gesetzt wurde oder keine Ahnung irgendwie es fehlen
00:30:44: Ressourcen oder so, dann wird automatisch eine E-Mail
00:30:47: versendet. Diese e-mail wird automatisch geöffnet ausgelesen und in der
00:30:51: projekt datenbank ist immer der ist stand von allen aufgaben also ich habe nicht
00:30:55: mehr die den fall dass ich mich in irgendwelche aufgabenlisten einarbeiten
00:30:58: muss muss mir die dann irgendwie auf dem Blatt Papier
00:31:02: exportieren oder rausschreiben und wir sind jetzt bei einem Punkt,
00:31:06: dass wir pro Monat mindestens 1650
00:31:10: Euro sparen und da sind alle Kosten von diesen Tools schon mit
00:31:14: eingerechnet. Also das was das tool jetzt quasi kostet
00:31:17: für einen durchlauf liegt irgendwo im cent bereich
00:31:21: je nachdem wie viele durchläufe wir haben sind wir vielleicht am tag bei fünf euro
00:31:25: plus minus aber wenn man das ganze jetzt gegen rechnet wenn wir mit fünf
00:31:29: mitarbeitern plus chef in einem raum zusammensitzen eine dreiviertel Stunde kann man sich
00:31:32: hochrechnen, was da an Lohnkosten zusammenkommt. Das jeden
00:31:36: Tag, 20 Arbeitstage im Monat. Und so kommen wir jetzt
00:31:40: wirklich auf eine Ersparnis von mindestens 1650 Euro
00:31:44: pro Monat, die der kunde durch eine einzige
00:31:47: prozessautomatisierung jetzt realisiert bekommt und da
00:31:51: sind wir jetzt an einem punkt wo ich einfach sage es geht nicht zwingend immer
00:31:54: darum wir müssen jetzt möglichst viel ja wie soll ich
00:31:58: sagen wir müssen jetzt möglichst viel neue aufträge generieren wir
00:32:02: müssen neue kunden gewinnen wir müssen sehen dass wir da irgendwie
00:32:07: mehr umsatz machen wenn die internen prozesse
00:32:11: so weit optimiert werden dass wir die möglichkeit haben bei jedem der
00:32:14: internen prozesse mindestens 50 prozent der zeit zu sparen
00:32:18: heißt es auf der anderen seite du hast entweder wieder zeit für andere
00:32:22: aufgaben in dem fall meines kunden ist es jetzt ganz einfach dass er gesagt
00:32:25: hat ich habe jetzt wieder zeit für vertrieb ich kann mich jetzt wieder meinen
00:32:29: vertriebsaufgaben widmen und muss nicht mehr jeden tag in dieser
00:32:32: runde zusammensitzen sondern kann das was jetzt noch übrig
00:32:36: ist die mitarbeiter zuweisen das habe ich in fünf minuten gemacht da brauche
00:32:40: ich aber keine mitarbeiter mehr für das mache ich in ruhe morgens früh bei einer
00:32:43: tasse kaffee bei einer tasse kaffee weiß ich alle Aufgaben zu und dann
00:32:47: läuft das ganze dann weiß jeder Mitarbeiter was zu tun ist und jetzt kann
00:32:51: ich mich wieder darum widmen neue Kunden zu akquirieren auch Kundenbesuche
00:32:55: wieder durchzuführen weil wir einfach jeden Tag ungefähr eine halbe dreiviertel
00:32:59: Stunde bis Stunde freigeräumt wird und das auf die woche hochgerechnet kann
00:33:02: man ja haben wir sind wir fast bei einem halben arbeitstag die man halt einfach
00:33:06: wieder gewonnen hat und wie gesagt das ganze jetzt hier
00:33:10: durch einen agent der eigenständig
00:33:13: die aufgaben erledigt und du musst dir einfach nur überlegen, was sind
00:33:17: deine täglichen Aufgaben, die du immer und immer wieder durchführst
00:33:21: und welche Schritte davon sind vielleicht möglich zu optimieren. Und wenn
00:33:25: du da diesen Weitblick einfach noch nicht hast, dann macht es vielleicht hier Sinn, dass
00:33:28: du dir ein Erstberatungsgespräch mit mir buchst. Wir uns das gemeinsam angucken,
00:33:32: wir uns anschauen, gibt es da überhaupt eine Möglichkeit Zeit zu sparen und die
00:33:35: Berechnung ist eigentlich total einfach. Wir schreiben auf, was kostet dich
00:33:39: dieser Ablauf, so haben wir es hier auch gemacht, pro Tag, pro Woche, pro
00:33:43: Monat, pro Jahr und dann steht dahinter eine Summe,
00:33:46: was sich dieser schritt im unternehmen jedes jahr kostet
00:33:51: und dann kann ich dir basierend darauf ein angebot
00:33:54: machen wo ich sage okay wenn wir das ganze jetzt aufgebaut haben und es
00:33:58: funktioniert wir haben das validiert dann steht eine summe hinter also das
00:34:02: heißt du gehst noch nicht mal ein risiko ein in dem falle das heißt wir
00:34:04: haben eine setup gebühr die liegt bedeutend darunter und wenn es
00:34:08: nicht funktionieren sollte die automatisierung da gehst du kein risiko einen haben
00:34:12: wir die setup gebühr gehabt aber du hast im grunde genommen
00:34:15: jetzt nicht eine höhere summe bezahlt für eine automatisierung die nachher nicht
00:34:19: läuft und wenn es läuft trägt sich das ganze von selber also du hast quasi
00:34:22: keinen verlust gemacht du kannst keinen verlust damit machen im gegenteil sondern du
00:34:26: gewinnst quasi ab dem moment wo die automatisierung läuft jeden
00:34:30: tag geld dazu du gewinnst zeit dazu einfach andere
00:34:33: wichtigere aufgaben durchzuführen die dich in deinem unternehmen weiterbringen
00:34:37: und das ist völlig unabhängig davon was du machst in meinem fall
00:34:41: sind es handwerker maschinenbauer maschinenbauunternehmen
00:34:46: und ja Also wenn du in irgendeinem dieser Bereiche unterwegs
00:34:50: bist und willst einfach mal darüber schauen, welche Aufgaben kannst du konkret
00:34:53: erledigen lassen von einem Agent, von einer
00:34:57: Automatisierung im Hintergrund, muss ja nicht zwingend ein Agent sein, dann buch dir ein
00:35:00: kostenfreies Erstberatungsgespräch mit mir und wir schauen uns die Sache gemeinsam an. Und
00:35:04: ansonsten würde ich sagen, bis zur nächsten Folge. Macht's gut, ciao!
00:35:15: Untertitel der Amara.org-Community