Maschinenbau trifft Marketing - Höhere Margen im Maschinenbau & Handwerk durch Marketing + Vertrieb

Transkript

Zurück zur Episode

00:00:00: Heute in der Folge geht es noch mal den letzten AI Agent, den ich gebaut

00:00:03: habe und die Erweiterung. Also ich habe noch ein paar Tools adaptiert an diesen Agents

00:00:07: selber. Ich will dir noch einen anderen zeigen, der sich gerade noch in dem Entwurfsstand

00:00:10: befindet, einfach dir ein bisschen das Gefühl zu geben, was mittlerweile möglich ist,

00:00:14: was mit diesen AI Agents machbar ist und ich habe noch ein kleines Beispiel

00:00:18: mitgebracht von einem Kundenprojekt, was letzte Woche, ja ich

00:00:21: würde mal sagen zu 95 Prozent abgeschlossen war. Wir sind jetzt

00:00:25: noch ein bisschen an ein paar Bugfixes dran, aber der erste Durchlauf ist

00:00:29: absolut vielversprechend und der kunde spart jetzt in einem vierstelligen

00:00:33: bereich jeden monat geld nur durch eine einzige

00:00:36: optimierung und ja wenn du wissen willst welche das war und was ich

00:00:40: vor allem jetzt hier aufgebaut habe und vor allem noch mehr wie du das

00:00:44: ganze vielleicht sogar in deinen alltag in deinen Business Alltag

00:00:47: integrieren kannst, dann bleibt dran, direkt nach dem Intro geht's los.

00:00:57: An der Stelle noch kurz, mein Name ist Felix Schmidt, Ich bin Maschinenbautechniker, habe

00:01:01: zehn Jahre Erfahrung im Maschinenbau, war in der Entwicklung tätig.

00:01:05: Bin seit 2022 im Marketing tätig und unterstütze jetzt mit

00:01:08: meinem eigenen Unternehmen Unternehmen im Bereich Handwerk, Maschinenbau,

00:01:12: Industrie, ihre Prozesse zu vereinfachen, mehr Kunden zu gewinnen durch

00:01:16: einfach eine erhöhte Sichtbarkeit, durch eine klare Kommunikation über

00:01:19: digitale Medien nach außen und wenn du mehr darüber wissen willst, welche

00:01:23: Prozesse ich hier durchführe, dann abonnier den Kanal, abonnier den Podcast, wo auch immer

00:01:26: du jetzt gerade zuhörst und gib den Videos, wenn auch immer du irgendwas hilfreiches

00:01:30: rausziehen konntest, ein Like, einen daumen nach oben und jetzt gehen wir weiter ins

00:01:34: thema wie eben angekündigt geht es heute noch mal diesen agent

00:01:37: und da habe ich dir noch mal die übersicht mitgebracht

00:01:41: ich hatte hier letztes mal ein agent aufgebaut der war

00:01:45: ein bisschen anders der hatte die tools direkt angebunden Also siehst

00:01:48: hier in dem Fall sind direkt die Tools angebunden

00:01:52: gewesen. Ich habe die noch hier unten drin gelassen für Kalender-Events,

00:01:56: für eine Notion-Datenbank und für eine E-Mail-Automatisierung.

00:02:00: Jetzt mittlerweile habe ich den Agent umgebaut und habe diesen

00:02:04: verschiedene Tools mitgegeben. Also verschiedene hier sieht man es schon

00:02:08: da ist ein Tool angebunden und dieses Tool ist quasi wieder ein

00:02:11: eigenständiger Agent der nur für eine bestimmte Aufgabe tätig ist. Ja fangen

00:02:15: wir aber vorne an damit das ganze so ein bisschen verständlich wird. Also wir starten

00:02:19: hier in dem Bereich von dem Trigger. Wir müssen hier mal gerade gucken. Also hier

00:02:23: ist der Trigger. Dann hier in dem Bereich haben wir den

00:02:26: Switch. Du

00:02:30: hast jetzt hier die Möglichkeit, dass du sagen kannst, okay,

00:02:34: kommt eine Voice Message rein oder kommt eine

00:02:38: Text Message rein. Also das ist ganz wichtig. Ich habe hier die Möglichkeit, in

00:02:41: Telegram einfach reinzusprechen und Telegram erkennt dann

00:02:45: automatisch oder die automatisierung erkennt dann automatisch. Handelt sich hier

00:02:49: im endeffekt eine voice message die erst noch transkribiert werden muss oder

00:02:52: handelt sich direkt einen eingegebenen text. Hintergrund ist der du bist vielleicht irgendwo

00:02:56: unterwegs du hast jetzt keine zeit unheimlich viel text da rein zu schreiben da ist

00:03:00: es in der regel einfacher du kannst das ganze aufnehmen sprichst es rein das

00:03:04: wird automatisch transkribiert und dann läuft das ganze

00:03:08: also du hast hier den workflow hier kommt das ganze an dann

00:03:12: läuft hierüber hier runter

00:03:16: läuft hier noch mal rein da holt er sich noch mal die ganzen Informationen und

00:03:20: dann geht es hier über diesen Pfad in den

00:03:23: Agent rein. Das ist wenn eine Voice Message kommt. Da gehen wir jetzt einfach mal

00:03:27: die einzelnen Punkte durch. Der Telegram Trigger, der zieht

00:03:30: sich jetzt erst mal eine Message. Wenn wir das ganze jetzt mal durchtesten, können wir

00:03:34: das einfach mal in dem Workflow ausprobieren. Wir gehen jetzt

00:03:38: hier mal auf Test. Also wir gehen jetzt hier oben, schalten wir

00:03:42: das ganze jetzt mal auf einen Live-Test.

00:03:46: Dann öffne ich mir die Telegram App und ziehe die mir hier

00:03:50: rüber. Und jetzt kann ich hier zum Beispiel sagen,

00:03:53: ja wir machen es direkt mit einer Voice Message. Welche Termine habe ich heute in

00:03:57: meinem Kalender? Jetzt können wir hier den Test-Workflow starten

00:04:01: bzw. Wir gehen jetzt hier rein und sagen test step

00:04:05: damit er nur den einen test zieht und jetzt sieht man hier in dem fall

00:04:08: ich mache gerade noch weil es ein bisschen stört hier den hintergrund weg

00:04:12: schuldigung in der stelle ob da ein neues videos setup da

00:04:16: muss ich mich erst mal ein wenig dran gewöhnen. Also hier hat man jetzt auf

00:04:19: jeden Fall den Text der reinkam.

00:04:23: Hier wird jetzt erkannt, es ist eine Audio Datei.

00:04:27: Von wem? Felix Schmidt, also der erkennt auch meinen Namen. Der erkennt vor allem eine

00:04:31: Message ID, die ist nachher wichtig, damit er das ganze speichern kann. Das sehen wir

00:04:34: aber jetzt im nächsten Schritt. Dann läuft das

00:04:37: ganze hier in den Bereich rein, in den Switch. Und da kommt jetzt,

00:04:42: wird jetzt quasi eine Wenn-Dann-Verknüpfung

00:04:46: aufgebaut. Also der guckt jetzt hier, existiert ein Text? Wenn

00:04:50: ja, dann gebe Text aus. Also der

00:04:53: exportiert jetzt erstmal nur einen Namen von der

00:04:57: sogenannten JSON, von dem JSON Code.

00:05:01: Kommt hier ein Bereich, ein Voice-File, also eine

00:05:04: MP3 rein, dann habe ich hier die Möglichkeit zu sagen Output Name

00:05:08: Voice und diese Output Names, da müssen wir gerade mal ein bisschen näher ran zoomen,

00:05:12: damit man das mal genau sieht, die siehst du jetzt hier in dem Fall. Jetzt

00:05:15: muss man gucken, ob wir hier treffen. Du hast jetzt hier den Fall,

00:05:18: dass dieser Switch quasi erstmal überprüft, was kommt für

00:05:22: eine Datei rein und entscheidet dann, okay es kommt ein Text raus

00:05:26: oder es kommt ein Voice, eine Voice Message raus. In

00:05:29: unserem Fall ist es eine Voice Message, das heißt wenn ich jetzt hier sage

00:05:34: Test Step, dann haben wir hier,

00:05:38: wie man hier sieht, hier habe ich jetzt die Output Bereiche

00:05:42: und ich habe jetzt hier ein Text Output und ein Voice Output und hier in

00:05:45: dem fall ist jetzt quasi ein voice output rausgegangen. Hier ist jetzt noch nichts mit

00:05:48: der datei passiert, die ist noch nicht transkribiert worden. Ist

00:05:52: jetzt alles quasi so wie es ja wie es reingekommen

00:05:56: ist. Jetzt geht es hier den pfad weiter. Wir gehen in den

00:05:59: bereich der Telegram App noch mal rein. Diese Telegram

00:06:03: App zieht sich jetzt noch mal die Datei. Also hier sieht man jetzt, der zieht

00:06:07: sich jetzt die File ID bzw. Die

00:06:10: Datei, die MP3 mit der Funktion Get und

00:06:14: referenziert diese ID über die letzten Knoten. Du

00:06:18: hast halt immer die Möglichkeit, wenn du das Schritt für Schritt durchspielst, dass du die

00:06:22: davorherigen Knoten quasi auswählen kannst. Und jetzt hier in dem Falle

00:06:26: kannst du hier auf Schema gehen und wenn man jetzt hier durch scrollt,

00:06:29: sieht man hier, da ist die File-ID und du hast jetzt hier die

00:06:33: Möglichkeit ich kann das ganze einfach jetzt mal rausschmeißen.

00:06:37: So jetzt ist das ganze hier leer und jetzt kannst du hier die File-ID einfach

00:06:40: nehmen und per drag and drop da reinziehen und dann hast du automatisch

00:06:44: hier diese id die wir vorher referenziert haben und

00:06:48: das ganze findest du jetzt auch noch mal hier unter dem bereich also hier unten

00:06:51: wird quasi noch mal die file id gezogen und da

00:06:55: so hast du es halt ohne dass du irgendwie coden musst oder irgendwelche

00:06:59: code schnipsel schreiben musst kannst du quasi hier einfach

00:07:02: deine ja kannst du hier einfach die teile die du

00:07:06: referenzieren willst per track and drop reinziehen Das kannst du aus jedem Bereich machen, ob

00:07:10: es aus der Tabelle ist, aus dem JSON-Bereich. Du kannst überall einfach hier die

00:07:13: Elemente packen und ziehst sie dir rein und wenn du diesen vorherigen

00:07:17: Trigger schon ausgelöst hast, zeigt er dir unten drunter auch die referenzierte

00:07:21: ID an, in dem Falle den Inhalt, der halt quasi dahinter steht.

00:07:25: So das ganze funktioniert, dann gehen wir hier auf Test Step und jetzt sehen wir

00:07:29: hier im Output Bereich, dass der hier, jetzt müssen wir mal gucken, ob wir auf

00:07:32: der richtigen Ecke unterwegs sind, hier zieht er sich jetzt quasi

00:07:37: die datei jetzt siehst du da ist ein binary aufgetaucht also

00:07:41: hier unten in dem bereich ist jetzt steht binary das

00:07:44: steht jetzt dafür Daten

00:07:48: egal ob es jetzt mp3 Daten, pdf Daten oder sonst irgendwas sind, dann

00:07:51: erscheint immer dieser zusätzliche binary Bereich, weil die halt über dieses

00:07:55: Format weitergegeben werden. Und da hast du jetzt die Möglichkeit wirklich zu

00:07:59: sagen, okay darauf greifen wir jetzt zu in dem nächsten

00:08:03: knoten jetzt sieht man hier wieder ganz schön da ist ein item weitergegeben worden

00:08:06: und das wird jetzt übertragen also die mp3 geht jetzt in

00:08:10: dem step rüber in den openai agent

00:08:14: entschuldigung ist gar kein agent in die openai schnittstelle

00:08:18: die ist wiederum mit meinem ja mit meiner

00:08:22: api verbunden also wenn du da mal irgendwie vielleicht mache ich mal ein extra Video,

00:08:25: wo es halt hier die APIs geht, weil ich finde, ja das ist relativ gut

00:08:29: dokumentiert, wenn du hier eine neue API anbinden willst, das ist also kein

00:08:33: Hexenwerk, dann gehst du einfach hier auf Create New

00:08:36: Credential und dann wirst du in dem Fall bei

00:08:40: einer OpenAI API nur noch dem Key gefragt. Also wenn

00:08:44: du ein OpenAI Account hast und hast die Möglichkeit auf deine APIs zuzugreifen,

00:08:47: kopierst du dir einfach rein, drückst auf verbinden und dann ist eigentlich schon

00:08:51: alles fertig. Jetzt wählst du hier in dem Falle aus

00:08:55: Audio, also du hast hier die Möglichkeit auf einen Textbot zu gehen, auf

00:08:58: ein Assistant zu gehen, den du dir vielleicht im Hintergrund aufgebaut hast. Du

00:09:02: willst vielleicht ein Bild generieren, dann musst du hier auf Image gehen und kannst dann

00:09:06: das Modell auswählen. Wir wollen aber jetzt hier in dem Fall eine Audiodatei transkribieren,

00:09:10: also wählen wir hier Audio aus und hier hast du jetzt die Operation

00:09:13: oder die Operation, die mit diesem Audio-File

00:09:17: passieren soll. Und da ist jetzt in dem falle

00:09:21: transcribe recording. Wir könnten das auch übersetzen

00:09:25: also wenn du jetzt sagen willst okay du hast eine audio datei in deutsch

00:09:28: aufgenommen willst sie direkt in dem step in englisch übersetzen dann könntest du das hier

00:09:32: mitmachen generate audio da kannst du halt ein

00:09:35: audio direkt von einem text prompt generieren lassen

00:09:39: aber wir in dem falle nutzen jetzt trans greif

00:09:42: recording und hier input data field name ist einfach nur data Das

00:09:46: ist quasi als fix hier reingeschrieben. Da brauchen wir keine Formel für, weil du siehst

00:09:50: hier in dem Bereich hier neben, da findest du den Punkt Data. Jetzt müssen wir

00:09:54: mal gucken, ob wir hier in der richtigen Ecke sind. Hier findest du den Bereich

00:09:57: Data und deswegen können wir das

00:10:01: jetzt da reinziehen und können sagen ok test step und lassen das ganze mal

00:10:05: durchlaufen und wenn man sich vielleicht noch erinnert ist jetzt ein paar minuten her

00:10:08: haben wir hier welche termine habe ich heute in meinem kalender

00:10:12: hat also wunderbar funktioniert und dieser input

00:10:16: geht jetzt quasi direkt rüber in den agent.

00:10:21: So was macht jetzt dieser agent? Gehen wir mal da rein.

00:10:25: Dieser agent hat jetzt den hintergrund, das habe ich in dem letzten video schon mal

00:10:28: grob erklärt, dass der automatisiert

00:10:33: auf basis natürlich einer anweisung die du ihm vorgibst

00:10:36: bestimmte handlungen ausführt das können handlungen sein dass er einfach nur eine

00:10:40: recherche reingeht also du kannst einen ganz einfachen agent aufbauen indem du

00:10:44: lediglich sagst wir können das ja hier mal gerade in einem Beispiel einfach hier neben

00:10:47: machen. Du sagst jetzt hier, du hast

00:10:50: einen Agent, gehst hier auf Advanced AI

00:10:54: und dann auf AI Agent und dann hast du hier entweder einen Tools

00:10:58: Agent, den nutze ich aktuell oder du kannst auch ein conversational agent nehmen,

00:11:02: der ist halt mehr so für eine, ja wenn er nur Konversationen

00:11:06: führt mit dir, aber nicht jetzt irgendwelche anderen Dateien

00:11:10: anpackt. Es gibt hier alles mögliche, also in

00:11:13: den meisten Fällen wirst du wahrscheinlich diesen Tools Agent nehmen und dann kannst du

00:11:17: hier sagen eigentlich in der Regel auch immer define below, also du

00:11:21: gibst dem jetzt hier vor was dieser Agent machen soll.

00:11:25: Dann braucht der Agent in ja ich würde sagen 95 Prozent aller

00:11:29: Fälle immer eine System Message, die du dem vorgibst, damit er genau weiß

00:11:33: wie er handhaben muss weil ganz so viel magie ist es dann doch

00:11:36: nicht also du musst ihm schon ganz präzise sagen was er für

00:11:40: aufgaben erfüllen soll und was er für aufgaben eben auch nicht erfüllen

00:11:44: soll und dann hast du hier im endeffekt quasi deinen agent wir können mal

00:11:47: gerade rausgehen der sitzt jetzt hier hinter hat sich schon angeknüpft

00:11:51: und jetzt sieht man hier noch ganz schön dass der ein

00:11:56: rotes dreieck hat mit einem ausrufezeichen drin also dem fehlt

00:11:59: noch irgendwas ein agent benötigt immer ein

00:12:03: chatmodel und da hast du dann die möglichkeit unterschiedliche modelle anzuwählen. Du siehst

00:12:07: hier in der liste, ich muss mal gerade mein bild ein bisschen wegziehen,

00:12:12: das war das falsche bild, muss mal gerade mein bild ein bisschen wegziehen.

00:12:15: Du siehst hier in der liste auf jeden fall ganz viele verschiedene modelle. Hier deep

00:12:19: seek ist mit drin, dann croc

00:12:23: von von ja hier ist es vom elon musk ist

00:12:27: da drin. Olama ist

00:12:31: quasi eine anbindung wo du verschiedene andere Tools quasi

00:12:34: lokal einbinden kannst. Also wenn es jetzt sensible Daten geht, die jetzt nicht unbedingt

00:12:38: mit dem World Wide Web geteilt werden sollen, dann kannst du hier

00:12:42: mit dem Tool Olama die Sprachmodelle

00:12:45: lokal bei dir installieren, entweder auf dem Server oder bei dir auf dem PC

00:12:49: und kannst damit chatten. Die Reaktionszeit geht dann ein bisschen nach oben, also es dauert

00:12:53: in der Regel länger, aber du hast die Möglichkeit hier wirklich dann, dass die Daten

00:12:57: bei dir bleiben und nicht irgendwie mit der Außenwelt geteilt

00:13:01: werden. In unserem Fall haben wir jetzt einfach OpenAI Chatmodel

00:13:04: genommen. Das binde ich hier an. Dann fragt er mich hier in dem Falle wieder,

00:13:08: welchen Account will ich nehmen. Wir lassen das jetzt hier auf dem Zweier stehen und

00:13:11: dann hast du die Möglichkeit aus der Liste, wie hier, quasi die

00:13:14: ganzen Chatmodelle auszuwählen, die aktuell in

00:13:18: dem Stand hier verfügbar sind. Jetzt sieht man, aktuell gibt es ja schon das

00:13:22: O3 Mini, dann O3 Mini Lite

00:13:26: oder so irgendwas. Ich weiß gar nicht auswendig wie die heißen. Die sind jetzt hier

00:13:30: aktuell noch nicht drin und wenn du jetzt sagst du hast keine komplizierten

00:13:33: aufgaben der soll jetzt nicht irgendwelche blog artikel oder wissenschaftliche arbeiten

00:13:37: schreiben dann kannst du ja einfach getrost auf 4o mini gehen

00:13:41: weil das ist aktuell relativ kostengünstig

00:13:45: und ja du darfst nicht vergessen alle anfragen die du

00:13:49: rausschickst über die api werden im endeffekt

00:13:52: auch berechnet und da hatten wir auch in dem kundenprojekt wo ich

00:13:56: nachher noch kurz darauf eingehe hatten wir den fall dass wir halt alleine in

00:14:00: der testphase weil wir 4 genommen haben, relativ schnell dann

00:14:03: für 100 Durchläufe, wo E-Mails quasi, also

00:14:07: bestimmte E-Mails die aus einem Operations- oder aus

00:14:13: einem Prozessmanagement-Tool rauskamen, die haben wir verarbeitet,

00:14:17: haben die übertragen in ein JSON-File und haben die dann wieder übertragen in eine

00:14:21: Datenbank, wo die kompletten Projekte dann drin verwaltet wurden. Und da waren

00:14:24: halt ruck zuck dann nach dem Test von irgendwie 150 E-Mails waren dann 14

00:14:28: Euro weg. Ist immer noch günstiger, als wenn es einer händisch gemacht hätte, aber man

00:14:32: sollte es halt nicht aus dem auge verlieren weil es kann auch ruck zuck wie

00:14:35: nach dem was du da machst kannst halt relativ teuer werden deswegen macht es sinn

00:14:39: auf jeden fall immer mit den günstigen modellen zu starten und wenn die die

00:14:43: aufgabe wunderbar erfüllen dann lässt man es dabei und wenn da irgendwo eine grenze erreicht

00:14:46: wird dann kann man immer noch überlegen ob man bestimmte aufgaben durch etwas teurere

00:14:50: modelle dann ersetzt jetzt hast du hier den fall dass

00:14:54: du einen memory hinzufügen kannst den habe ich jetzt hier wie man

00:14:57: hier sieht in meinem agent ich ziehe mal mein bild wieder ein bisschen hierüber so

00:15:01: da wo es war hier in dem agent siehst du auch dass ich ein

00:15:04: memory eingebaut habe und dieser memory bereich der

00:15:08: speichert sich quasi meine nachrichten die eingegangen sind und das hat

00:15:12: einfach den hintergrund wenn du das nicht machen würdest

00:15:15: dann könntest du nicht mit diesem Agent in Interaktion treten. Also er gibt dir

00:15:19: irgendeinen Output raus und dann sagst du ja okay das passt jetzt noch nicht ganz,

00:15:23: da habe ich mir ein anderes Ergebnis gewünscht. Wenn du keinen Memory Speicher da

00:15:26: drin hast, der sich wirklich merken würde die letzten 4, 5,

00:15:30: 6 nachrichten, dann würde der immer wieder von vorne

00:15:34: anfangen. Deswegen ist es halt gerade bei so Konversationen, die du

00:15:37: führst, unheimlich wichtig, einen Memory Bereich einzubauen. Der ist auch hier

00:15:41: integriert, da brauchst du gar nicht, ist keine Raketenwissenschaft, klickst einfach hier

00:15:45: drauf, Window Buffer oder Window Buffer Memory,

00:15:48: kannst den dann noch benennen und kannst hier dann in dem Fall auch wieder

00:15:52: sagen Define Below. Hier können wir jetzt nichts auswählen, weil wir

00:15:56: nichts angeknüpft haben, aber ich zeige es dir einfach mal gerade in dem anderen Bereich.

00:15:59: Hier siehst du halt noch, aktuell merkt er sich die

00:16:02: letzten fünf konversationen wir gucken uns das ganze jetzt aber mal

00:16:06: hier an wie ich es hier eingebunden habe du

00:16:10: hast jetzt hier den key und das ist wenn man jetzt hier mal guckt dass

00:16:13: es telegram trigger darauf greift er zu dann über item.json.message.chatid

00:16:19: zieht er sich die Chat ID raus und die ist halt wichtig, dass er sich

00:16:22: darauf immer wieder referenzieren kann und weiß, okay ich muss mir immer wie in diesem

00:16:26: Fall die letzten fünf Nachrichten abspeichern.

00:16:30: Dann hast du jetzt hier jetzt würde so der agent könnte

00:16:34: so schon funktionieren also der braucht jetzt einen eingang der braucht

00:16:38: diese beiden bereiche und dann bräuchte der noch ein output aber der bräuchte

00:16:42: nicht mit aller gewalt ein tool sondern es würde auch

00:16:46: ohne ein Tool funktionieren. Wenn man jetzt hier sagt, okay da kommt jetzt noch ein

00:16:49: Eingang rein. Keine Ahnung wir nehmen einfach mal,

00:16:54: ziehen den einfach mal darüber. Geht ja relativ gut. So dann können

00:16:58: wir dem jetzt hier sagen, okay define below jetzt war

00:17:02: der noch rot. Bitte beantworte

00:17:11: die die frage des benutzer.

00:17:15: So you are helpful assistant hier können wir jetzt reinschreiben

00:17:19: du beant

00:17:24: jetzt gucken wir mal gerade sie jetzt sieht man hier jetzt ist alles weg was

00:17:28: irgendwie zu einem fehler geführt hätte und jetzt habe ich hier die möglichkeit zu sagen

00:17:32: ok test step jetzt hat er hier natürlich

00:17:36: den noch mal fehler gebracht weil der window buffer memory in dem falle nicht

00:17:39: richtig konfiguriert war jetzt würde ich dem hier quasi

00:17:43: einfach diesen key einfach mal mitgeben oder wir können es auch mal

00:17:47: selber aufbauen also wir brauchen hier den key jetzt gehen wir hier in dem

00:17:50: falle auf expression also auf formel und haben jetzt hier die möglichkeit

00:17:54: über die geschweifte klammer einfach die

00:17:58: bei mac ist es option 8 da kann man das eintragen und jetzt

00:18:01: habe ich hier die möglichkeit dann geht er automatisch in diesen code bereich rein und

00:18:05: jetzt kann ich hier gucken ok der soll das aus dem telegram trigger ziehen also

00:18:09: aus dem ersten note dann gehe ich auf punkt dann

00:18:12: schlägt er mir item vor jetzt sieht man hier alles was da irgendwie reinkommt

00:18:16: aber wir wollen ja nur die chat id haben dann gehen wir auf jason sieht

00:18:20: man immer noch das ganze und jetzt kann man hier auf Message

00:18:23: gehen, Chat-ID.

00:18:28: Jetzt sehen wir hier, da ist wieder die ID drin, wie im

00:18:31: letzten knoten und jetzt sollte auch hier in dem falle der fehler weg sein wenn

00:18:35: wir hier auf test step gehen und jetzt sehen wir hier ok der

00:18:39: zieht das ganze jetzt daraus hier sieht man hier neben so ein bisschen den

00:18:43: chat ich hoffe man kann es einigermaßen sehen ich ziehe das fenster rüber bitte beantwortet

00:18:47: die frage des benutzer system message das zieht er mit rein

00:18:53: und gucken jetzt mal hier was gerne was ist die Frage. Also hier kommt

00:18:56: jetzt die Frage, weil er das wahrscheinlich nicht richtig übernommen hat aus

00:19:00: dem Bereich. Jetzt müssen wir gerade mal gucken was da an input reingekommen

00:19:04: welche termine habe ich heute in meinem kalender also man sieht jetzt hier der

00:19:08: hat den input schon genommen beantworte die frage

00:19:11: des benutzers hier ist jetzt der fehler

00:19:16: Hier müsste ich jetzt zum Beispiel sagen,

00:19:19: ich müsste hier den Text reinziehen, weil er jetzt hier nicht wusste, was die Frage

00:19:23: ist. Wenn wir jetzt noch mal auf Test Step gehen, sollte er hier, es tut

00:19:26: mir leid, aber ich habe keinen Zugriff auf deinen Kalender oder persönliche Daten. Du kannst

00:19:29: jedoch einfach deine Kalender App öffnen, deine Termine für heute zu

00:19:33: prüfen. Brauchst du Hilfe bei etwas anderem? So

00:19:37: jetzt haben wir natürlich hier den Fall, dieser Agent hat jetzt nur

00:19:41: Zugriff auf das Chat Modell, der Zugriff auf die letzten Nachrichten,

00:19:45: aber er hat jetzt keinen zugriff auf das kalender modell oder auf das kalender tool

00:19:49: und genau deswegen haben wir jetzt hier den punkt dass dieser agent diese aufgabe

00:19:53: nicht erfüllen kann aber du könntest jetzt hier zum beispiel sagen was

00:19:56: ist keine ahnung 25 plus 5

00:20:01: also alles was wofür der agent jetzt keine exorbitant großen tools braucht

00:20:05: kannst du jetzt hier hinzufügen könnte es jetzt hier zum beispiel auch sagen

00:20:09: hier gibt es auch calculator wenn du jetzt irgendwas berechnen musst könntest du jetzt

00:20:12: hier ein taschenrechner hinzufügen und dann würde er

00:20:16: als tool auf diesen taschenrechner hin zugreifen wenn du jetzt

00:20:20: sagen würdest okay was ist 3 plus 5 wir können das ganze

00:20:24: einfach noch mal testen in dem falle machen das ganze jetzt

00:20:27: einfach noch mal auf test workflow was ist 3

00:20:31: plus 5 minus 7 ziehen wir uns das ganze mal hier

00:20:35: rüber jetzt hat er wieder ein audio file hat er erkannt

00:20:39: hier hat er es wieder rüber gezogen

00:20:44: hier hat er die datei runtergeladen in dem falle sollte jetzt das

00:20:47: transcript erstellt werden. Was ist 3 plus 5 minus 7? Okay

00:20:51: das hat er schon mal erkannt und jetzt gehen wir mal hier in

00:20:55: den agent rein und gucken ob er das mit dem kalkulator macht. Ich versuche es

00:20:58: mal hier über das play zu machen, damit man sieht was hier im hintergrund passiert.

00:21:03: So 3 plus 5 sind

00:21:06: 8 minus 7 müsste jetzt 1 rauskommen deswegen bin ich mal gespannt.

00:21:11: 3 plus 5 minus 7 ergibt 1. Also man sieht jetzt

00:21:14: hier der hat sich die nachricht gezogen. In diesem bereich hat er das ganze

00:21:18: jetzt in eine aufgabe für den agent umgewandelt also das chat modell ist quasi

00:21:22: immer dafür da dass eine aufgabe erstellt werden kann wie

00:21:26: der agent löst der hat sich hier noch mal auf die nachricht bezogen

00:21:30: hat die hier reingezogen und hier sieht man immer wenn man ein bisschen näher heran

00:21:33: zoomt in dem fall jetzt ist mein stift weg den ich eigentlich nehmen wollte so

00:21:36: hier sieht man jetzt immer in dem falle der

00:21:40: zieht hat zwei durchläufe hier drin gehabt

00:21:43: hier hat er auch noch ein durchlauf gehabt den ich jetzt ein bisschen wo ich

00:21:46: leider ein bisschen daneben gemalt habe hier hat er einen durchlauf gehabt und

00:21:50: wenn man jetzt hier in den kalkulator mal reingeht also man hat auch immer die

00:21:53: möglichkeit jetzt doppelklick auf die datei zu machen hier hat er jetzt die

00:21:57: anfrage schon umgewandelt in 3 plus 5

00:22:01: minus 7 also er hat schon mal die gesprochenen also die

00:22:04: texte quasi umgewandelt in rechenformate rechenzeichen und hat hier

00:22:08: das ergebnis 1 ausgegeben und das gibt er jetzt wieder

00:22:12: zurück und der agent wandelt das dann in eine klare

00:22:15: antwort dass er hier zum beispiel sagt 3 plus 5 minus 7 ergibt 1

00:22:19: und das schöne hier dran ist jetzt dass der agent von alleine

00:22:23: erkannt hat was für eine aufgabe muss ich erfüllen

00:22:27: wählt dann das entsprechende tool aus was ihm zur verfügung gestellt

00:22:31: wird sofern es halt da ist dieses tool dann zu nutzen die

00:22:35: aufgabe zu erfüllen und wenn man jetzt hier wenn du n8n

00:22:38: zum beispiel in dem fall ist das automatisierung tool wenn du es dir in der

00:22:41: freien version runterlässt und guckst dir einfach mal an was für tools du mittlerweile

00:22:45: hier anbinden kannst du kannst vector datenbank anbinden

00:22:50: Also ich habe noch gar nicht alle Tools hier durchgeguckt. Airtable, wenn du Airtable zum

00:22:54: Beispiel nutzt, machen relativ viele. Ich nutze jetzt in meinem Fall Notion, aber

00:22:57: auch Notion kannst du anbinden. Du kannst auf AWS

00:23:01: zugreifen. Also alles was jetzt hier irgendwie so mit Daten und Datenmanagement zu

00:23:05: tun hat, ist hier drin. ClickUp kannst du verwenden,

00:23:09: wird der ein oder andere vielleicht kennen. Und du hast wirklich

00:23:12: unfassbar, hier DEEPL, also wenn du irgendwas quasi übersetzen

00:23:16: musst oder du willst irgendwas schreiben hier ist jetzt in dem falle die be translate

00:23:20: data using die bel dll tun weiß ich jetzt gar nicht was man

00:23:23: damit kannst wahrscheinlich post automatisierung dann direkt machen also du

00:23:27: hast unzählige tools und da macht es wirklich einfach mal sinn sich das ganze mal

00:23:31: anzuschauen und da mal rein zu gucken und mit dem blick auf die uhr

00:23:34: und einer knappen halben stunde würde ich sagen ich habe dir jetzt wahrscheinlich an dem

00:23:38: einfachen beispiel relativ gut erklärt wie so ein agent

00:23:42: funktioniert was dieser machen kann Und jetzt in

00:23:45: meinem Fall habe ich halt hier gesagt, okay, ich gebe ihm Tools

00:23:49: mit an die Hand. Hier wäre jetzt ein Kalender-Tool.

00:23:53: Dann hätte ich hier ein Kontakt-Daten-Tool, was halt auf meine Kontaktdaten

00:23:57: zugreift. Wenn ich jetzt eine E-Mail schreiben will, beispielsweise,

00:24:01: ich transkribiere irgendwas und sage, schreib mir bitte eine E-Mail an

00:24:05: xyz mit dem und dem hin inhalt dann würde

00:24:08: dieses dieser agent automatisiert die email

00:24:12: adresse raussuchen die er dann in dem nächsten agent der die email adresse dann ver

00:24:15: oder die email dann verfasst dieser hat dann meinen schreibstil

00:24:19: angelernt also der nutzt mein transkript nutzt dann meinen angelernten

00:24:23: Schreibstil, daraus direkt eine vernünftige E-Mail zu formulieren. Da ist meine

00:24:27: Signatur drin. Dann habe ich hier einen

00:24:31: Task Manager Agent. Dieser Task Manager Agent, der sagt mir zum

00:24:34: Beispiel, da könnte ich jetzt neue Aufgaben anlegen. Wenn ich jetzt eine E-Mail

00:24:38: bekommen habe, beispielsweise, die automatisch in eine Aufgabe

00:24:42: überführt werden soll, dann könnte ich das entweder so einbinden, dass das

00:24:45: automatisiert passiert, oder ich könnte es so einbinden, dass ich zum Beispiel eine

00:24:49: Sprachnachricht mache und sage, lege mir eine Aufgabe in meiner Aufgabendatenbank

00:24:53: an mit dem Titel XYZ und der

00:24:57: Fälligkeit übermorgen und dann keine

00:25:00: Ahnung noch einen Betreff beispielsweise, wenn ich es nachher per e-mail versenden

00:25:04: will also so wie ich meine aufgabendaten waren quasi ja

00:25:08: aufgebaut habe und hier im letzten fall haben wir noch den

00:25:11: e-mail agent der halt dafür sorgt dass ich halt e-mails versenden kann

00:25:15: meeting anfragen versenden kann und hinter diesen

00:25:19: tools stecken immer ja unterschiedliche agents

00:25:23: wir können es hier das ganze mal anmachen hier wäre zum beispiel der task agent

00:25:26: der ist auch inaktiv weil die tools die quasi aufgerufen werden

00:25:30: die müssen nicht aktiviert werden weil in dem Falle

00:25:34: sieht man hier die werden gesteuert über einen externen Trigger

00:25:37: Workflow Input Trigger und das ist quasi genau

00:25:41: der hier. Jetzt haben wir hier den Task Manager. Der bekommt

00:25:45: eine kurze Beschreibung mit. Können wir auch das ganze mal aufmachen. Du bist für die

00:25:48: Aufgabenverwaltung zuständig und kümmerst dich anfragen zu laufenden Aufgaben

00:25:52: oder erstellst neue auf anfragen neue Aufgaben

00:25:56: in dem du die relevanten Punkte vom User abfragst.

00:26:01: Das ganze geht dann an also der greift auf eine

00:26:04: datenbank zu auf eine datenbank von meinen agents quasi und

00:26:08: dann kann ich die hier auswählen jetzt habe ich hier den fcm task agent ausgewählt

00:26:12: hier sieht man den oben fcm task agent das heißt sobald

00:26:16: eine Anfrage von diesem hier an den Task Agent

00:26:19: geht, wird die komplette Anfrage überführt, kommt hier rein

00:26:23: und geht hier in den nächsten Agent rein. Und dieser Agent ist jetzt ganz

00:26:27: spezialisiert nur auf meine Aufgabendatenbank

00:26:31: oder nur für meine Aufgaben in der Aufgaben Datenbank verantwortlich und das ist

00:26:35: das schöne, weshalb du nahezu unendlich große Systeme hier aufbauen

00:26:38: kannst, weil du einfach deine Aufgaben runter brichst

00:26:43: in einzelne Schritte, die nacheinander und in gewissen

00:26:46: reihenfolgen abgearbeitet werden müssen das gibt dir halt die unfassbare möglichkeit

00:26:50: zu sagen du hast für jede aufgabe

00:26:54: einen eigenen agent der ganz konzentriert

00:26:57: experte in diesem einen bereich ist und er muss auch gar nichts anderes können und

00:27:01: das gibt es zudem auch genauso vor. Also du konfigurierst quasi

00:27:04: die Grenzen, die dieser Agent hat und hast so die

00:27:08: Möglichkeit, dass du die Aufgaben ganz spezifisch aufbauen,

00:27:12: aufsetzen kannst, ohne dass irgendwas anderes noch mit

00:27:16: dabei gemischt wird und so hast du halt wirklich die möglichkeit wenn du das ganze

00:27:19: ins feintuning rein feintuning reinbringst dass so ein

00:27:23: agent wirklich komplette aufgaben von dir eigenständig

00:27:26: erledigen kann mit einem einzigen trigger den du dir

00:27:30: mit gibst und das muss nicht mal in dem Falle wie hier eine Nachricht

00:27:34: sein, das kann auch ein Datei-Upload sein. Also du hast ein Onboarding mit

00:27:38: einem Kunden beispielsweise, ihr habt das ganze in Teams gemacht,

00:27:41: habt dann Transkript automatisch in Teams anlegen lassen,

00:27:45: dann könntest du dieses Transkript, die Audiodatei in den Ordner speichern

00:27:49: und sobald da eine Datei in dem Ordner landet, läuft diese

00:27:52: Automatisierung los und weiß ganz genau, wenn in dem Ort eine Datei auftaucht,

00:27:56: dann habe ich ein Onboarding hinter mich gebracht und dann läuft ein Prozess ab.

00:28:00: Dann kannst du die einzelnen Schritte rausziehen, du kannst schon mal die einzelnen,

00:28:04: keine Ahnung, wenn es darum geht, neue Teile für einen Kunden zu

00:28:08: fertigen oder so, dann kannst du auf Basis von dem Transkript dir

00:28:12: schon mal Aufgaben erstellen lassen in einem Board, die nacheinander

00:28:15: abgearbeitet werden müssen. Und so all das, was du quasi

00:28:19: händisch machen musst, läuft dann in einem Automatisierungsschritt ab. Und

00:28:22: jetzt noch ganz kurz zu dem fall der kunde der hatte ein

00:28:26: thema der hatten also da gibt es auch noch eine folge mit dem kunden zu

00:28:30: aber jetzt schon mal so als kleinen Ausblick. Der hatte ein Datenverwaltungstool

00:28:34: oder so ein Projekttool, ein internes, was keine guten

00:28:37: Schnittstellen zu externen Tools hat. Das ist eigentlich immer so das große Problem,

00:28:41: wenn du Tools einsetzt, die keine Schnittstelle zu anderen

00:28:45: zu anderen Programmen hat. In dem Fall war es so, also mussten wir

00:28:49: über den Weg E-Mail gehen. Das Programm konnte E-Mails versenden und wir haben quasi ein

00:28:53: E-Mail Template aufgebaut, was immer die gleiche Struktur hat. Wo eine

00:28:56: Auftragsnummer, ja wenn vorhanden Kundendaten,

00:29:00: aber in der regel waren es halt kunden nummern die wurden rausgegeben

00:29:04: dann wurde dieser kunden nummer waren dann aufträge

00:29:08: zugeordnet die erledigt werden müssen also es gab verschiedene parameter die

00:29:11: immer in einer e-mail rausgegeben wurden und das war sozusagen

00:29:15: der trigger Diese E-Mail ging immer an eine einzige E-Mail Adresse, die wir dafür

00:29:19: angelegt haben und sobald eine E-Mail reinkam, wurde die quasi

00:29:23: geöffnet, ausgelesen und an den Agent übertragen und

00:29:27: dann hat dieser Agent quasi erstmal überprüft, welcher Inhalt steht da

00:29:30: drin und auf Basis von der Auftragsnummer wurde eine

00:29:34: Projektdatenbank nach der Auftragsnummer durchsucht. Wenn

00:29:38: diese existierte, wurde geguckt, hat sich der Status

00:29:41: geändert, sind irgendwelche Informationen dazu gekommen. Dann wurde quasi ein

00:29:45: update dieser aufgabe in der datenbank vorgenommen wenn diese

00:29:48: auftragsnummer noch nicht existierte wurde in der datenbank eine neue

00:29:52: aufgabe angelegt und die kompletten inhalte der e-mail wurden dann in diese

00:29:56: datenbank übertragen und das hatte halt den vorteil dass im

00:29:59: vorfeld haben ja hat der kunde sich jeden tag

00:30:03: mit seinen mitarbeitern zusammengesetzt das kann man eine halbe stunde gewesen sein mal eine

00:30:07: dreiviertel stunde aber jeden tag und ist in diesem projekt

00:30:10: verwaltungstool alle aufgaben durchgegangen

00:30:14: hat die übertragen in excel sheet in dem excel sheet

00:30:18: wurden dann mitarbeiter zugegeben zugewiesen die hat gesagt haben

00:30:21: okay der Mitarbeiter ist für das zuständig und das wurde alles aus dem

00:30:25: Programm händisch übertragen, weil wir auch keine Möglichkeit hatten, diese Daten automatisiert

00:30:29: an das nächste Tool zu übergeben. Und jetzt haben wir den Fall,

00:30:33: die E-Mail kommt rein. Also wenn irgendwo in dem kompletten

00:30:36: Betrieb in diesem Projektverwaltungstool irgendwas auf

00:30:40: den nächsten Status gesetzt wurde oder keine Ahnung irgendwie es fehlen

00:30:44: Ressourcen oder so, dann wird automatisch eine E-Mail

00:30:47: versendet. Diese e-mail wird automatisch geöffnet ausgelesen und in der

00:30:51: projekt datenbank ist immer der ist stand von allen aufgaben also ich habe nicht

00:30:55: mehr die den fall dass ich mich in irgendwelche aufgabenlisten einarbeiten

00:30:58: muss muss mir die dann irgendwie auf dem Blatt Papier

00:31:02: exportieren oder rausschreiben und wir sind jetzt bei einem Punkt,

00:31:06: dass wir pro Monat mindestens 1650

00:31:10: Euro sparen und da sind alle Kosten von diesen Tools schon mit

00:31:14: eingerechnet. Also das was das tool jetzt quasi kostet

00:31:17: für einen durchlauf liegt irgendwo im cent bereich

00:31:21: je nachdem wie viele durchläufe wir haben sind wir vielleicht am tag bei fünf euro

00:31:25: plus minus aber wenn man das ganze jetzt gegen rechnet wenn wir mit fünf

00:31:29: mitarbeitern plus chef in einem raum zusammensitzen eine dreiviertel Stunde kann man sich

00:31:32: hochrechnen, was da an Lohnkosten zusammenkommt. Das jeden

00:31:36: Tag, 20 Arbeitstage im Monat. Und so kommen wir jetzt

00:31:40: wirklich auf eine Ersparnis von mindestens 1650 Euro

00:31:44: pro Monat, die der kunde durch eine einzige

00:31:47: prozessautomatisierung jetzt realisiert bekommt und da

00:31:51: sind wir jetzt an einem punkt wo ich einfach sage es geht nicht zwingend immer

00:31:54: darum wir müssen jetzt möglichst viel ja wie soll ich

00:31:58: sagen wir müssen jetzt möglichst viel neue aufträge generieren wir

00:32:02: müssen neue kunden gewinnen wir müssen sehen dass wir da irgendwie

00:32:07: mehr umsatz machen wenn die internen prozesse

00:32:11: so weit optimiert werden dass wir die möglichkeit haben bei jedem der

00:32:14: internen prozesse mindestens 50 prozent der zeit zu sparen

00:32:18: heißt es auf der anderen seite du hast entweder wieder zeit für andere

00:32:22: aufgaben in dem fall meines kunden ist es jetzt ganz einfach dass er gesagt

00:32:25: hat ich habe jetzt wieder zeit für vertrieb ich kann mich jetzt wieder meinen

00:32:29: vertriebsaufgaben widmen und muss nicht mehr jeden tag in dieser

00:32:32: runde zusammensitzen sondern kann das was jetzt noch übrig

00:32:36: ist die mitarbeiter zuweisen das habe ich in fünf minuten gemacht da brauche

00:32:40: ich aber keine mitarbeiter mehr für das mache ich in ruhe morgens früh bei einer

00:32:43: tasse kaffee bei einer tasse kaffee weiß ich alle Aufgaben zu und dann

00:32:47: läuft das ganze dann weiß jeder Mitarbeiter was zu tun ist und jetzt kann

00:32:51: ich mich wieder darum widmen neue Kunden zu akquirieren auch Kundenbesuche

00:32:55: wieder durchzuführen weil wir einfach jeden Tag ungefähr eine halbe dreiviertel

00:32:59: Stunde bis Stunde freigeräumt wird und das auf die woche hochgerechnet kann

00:33:02: man ja haben wir sind wir fast bei einem halben arbeitstag die man halt einfach

00:33:06: wieder gewonnen hat und wie gesagt das ganze jetzt hier

00:33:10: durch einen agent der eigenständig

00:33:13: die aufgaben erledigt und du musst dir einfach nur überlegen, was sind

00:33:17: deine täglichen Aufgaben, die du immer und immer wieder durchführst

00:33:21: und welche Schritte davon sind vielleicht möglich zu optimieren. Und wenn

00:33:25: du da diesen Weitblick einfach noch nicht hast, dann macht es vielleicht hier Sinn, dass

00:33:28: du dir ein Erstberatungsgespräch mit mir buchst. Wir uns das gemeinsam angucken,

00:33:32: wir uns anschauen, gibt es da überhaupt eine Möglichkeit Zeit zu sparen und die

00:33:35: Berechnung ist eigentlich total einfach. Wir schreiben auf, was kostet dich

00:33:39: dieser Ablauf, so haben wir es hier auch gemacht, pro Tag, pro Woche, pro

00:33:43: Monat, pro Jahr und dann steht dahinter eine Summe,

00:33:46: was sich dieser schritt im unternehmen jedes jahr kostet

00:33:51: und dann kann ich dir basierend darauf ein angebot

00:33:54: machen wo ich sage okay wenn wir das ganze jetzt aufgebaut haben und es

00:33:58: funktioniert wir haben das validiert dann steht eine summe hinter also das

00:34:02: heißt du gehst noch nicht mal ein risiko ein in dem falle das heißt wir

00:34:04: haben eine setup gebühr die liegt bedeutend darunter und wenn es

00:34:08: nicht funktionieren sollte die automatisierung da gehst du kein risiko einen haben

00:34:12: wir die setup gebühr gehabt aber du hast im grunde genommen

00:34:15: jetzt nicht eine höhere summe bezahlt für eine automatisierung die nachher nicht

00:34:19: läuft und wenn es läuft trägt sich das ganze von selber also du hast quasi

00:34:22: keinen verlust gemacht du kannst keinen verlust damit machen im gegenteil sondern du

00:34:26: gewinnst quasi ab dem moment wo die automatisierung läuft jeden

00:34:30: tag geld dazu du gewinnst zeit dazu einfach andere

00:34:33: wichtigere aufgaben durchzuführen die dich in deinem unternehmen weiterbringen

00:34:37: und das ist völlig unabhängig davon was du machst in meinem fall

00:34:41: sind es handwerker maschinenbauer maschinenbauunternehmen

00:34:46: und ja Also wenn du in irgendeinem dieser Bereiche unterwegs

00:34:50: bist und willst einfach mal darüber schauen, welche Aufgaben kannst du konkret

00:34:53: erledigen lassen von einem Agent, von einer

00:34:57: Automatisierung im Hintergrund, muss ja nicht zwingend ein Agent sein, dann buch dir ein

00:35:00: kostenfreies Erstberatungsgespräch mit mir und wir schauen uns die Sache gemeinsam an. Und

00:35:04: ansonsten würde ich sagen, bis zur nächsten Folge. Macht's gut, ciao!

00:35:15: Untertitel der Amara.org-Community