Skip to Content

Tech

27 posts

Posts tagged with Tech

Gert Scobel über generative KI als lehrreicher Spiegel

„Die wahre menschliche Alphabetisierung im KI-Zeitalter bedeutet also gerade nicht, unsere Begrenztheit zu überwinden, Code und Programm als Quelle der Bedeutung zu verstehen[...]."

Gert Scobel über generative KI als lehrreicher Spiegel
Foto: Rishabh Dharmani / Unsplash

Es freut mich wirklich sehr, dass Gert Scobel das mit der Rente nur so halb ernst gemeint hat und jetzt auf Youtube weitermacht. Seine Videos stoßen mir bisher immer neue Türen auf und bieten Perspektiven, die im „Tagesgeschäft" vom Schaum vor den Mündern eher verdeckt werden.

Auch sein Video über generative KI war für mich in dieser Hinsicht sehr bereichernd:

Die Frage der Zukunft ist daher, ob und wie wir KI wirklich nutzen können, um selber weise zu werden. Shukai Matsumoto sagt: Eine KI zeigt uns nicht, wie wir werden sollen, sondern wer wir jetzt sind. Sie fungiert als ein philosophisches Kontrastmittel, das unsere eigene Natur und unsere eigene Perspektive erst sichtbar macht. Und das ist sehr lehrreich, aber auf eine ganz andere Weise, als wir normalerweise glauben.

Die wahre menschliche Alphabetisierung im KI-Zeitalter bedeutet also gerade nicht, unsere Begrenztheit zu überwinden, Code und Programm als Quelle der Bedeutung zu verstehen, selber coden und programmieren zu können. Wir sind es, die einem Phänomen Bedeutung geben. Wir. Und wir geben auch der KI ihre Bedeutung.

Was wir brauchen, ist in seinen Augen ein neuer Humanismus, der nicht auf der Überlegenheit über andere Wesen basiert, sondern unser eigenes Bewusstsein kultiviert und transparent macht für die Einzigartigkeit und Zerbrechlichkeit unserer eigenen, aber relativen Existenzweise.

Mit Parakeet: 81 Minuten Video in nur 39 Sekunden transkribiert

Ich will nicht mehr ohne Macwhisper leben.

Mit Parakeet: 81 Minuten Video in nur 39 Sekunden transkribiert

Ich bin ein großer Fan von Sprachmemos an mich selbst. So entlade ich etwa meinen Bewusstseinsstrom nach einem Film direkt in mein Smartphone, um diese Gedanken später am Rechner zu ordnen und sie halbwegs lesbar hier zu veröffentlichen. Oder wenn ich mit Podcast auf den Ohren unterwegs bin und ich zu dieser einen Stelle jetzt wirklich Meinung loswerden muss.

Damit ich nicht irgend eine Cloud mit meiner Stimme füttern muss, damit am Ende Elon einen Sexbot damit trainiert, setze ich auf lokale Transkription direkt auf dem Laptop. Das Tool meiner Wahl, dass ich allen Mac-Nutzer:innen wärmstens ans Herz legen möchte: Macwhisper. Damit kann man sich unterschiedliche Sprachmodelle auf den Rechner laden, um damit Podcasts und Videos zu transkribieren, dann daraus Untertitel zu erstellen, einen Text direkt zu diktieren oder eben mäandernde Sprachmemos möglichst unkompliziert zu verschriftlichen.

Das Modell meiner Wahl war bisher das Whisperkit Large v3 Turbo, weil es vergleichsweise absurd genau ist und eine Datei in einem akzeptablen Tempo transkribiert. Doch mit Nvidias neuem Sprachmodell, Parakeet v3, haben sich die Bedingungen für das, was als akzeptabel durchgeht, radikal geändert.

0:00
/0:12

Video via Goodsnooze, noch mit der Vorgängerversion Parakeet v2

So wie ich das verstanden habe, hat Nvidia diese Technik vorangetrieben, um Livevideo simultan untertiteln zu können. Ich habe es getestet und bin einigermaßen baff. Dafür habe ich das Tool mit einem Link zu einem 81-minütigen Youtube-Video gefüttert. Vom automatischen Runterladen der Tonspur bis zum fertigen Transkript inklusive Sprecher:innen-Erkennung und -Zuordnung sind gerade einmal 39 Sekunden(!) vergangen. (Einen Vorher-Nachher-Vergleich habe ich an dieser Stelle gar nicht. Eine etwa fünfminütige Sprachmemo hat mit dem alten Whisperkit jedoch länger gedauert, als die 81 Minuten Tonspur eines Videos. 🤯)

Macwhisper ist grundlegend erst mal kostenlos, aber nur mit ungenaueren Sprachmodellen. Auf Parakeet v3 lässt sich momentan nur mit Pro-Lizenz zugreifen, die aktuell mit 59 Euro zu Buche schlägt. Aus meiner Sicht lohnt sich diese Ausgabe absolut.

🎙️ MacWhisper
Quickly and easily transcribe audio files into text with OpenAI’s state-of-the-art transcription technology Whisper as well as Nvidia Parakeet. Whether you’re recording a meeting, lecture, or other important audio, MacWhisper quickly and accurately transcribes your audio files into text.📲 MacWhisper is now also available on iPhone and iPad, download it here.Full Feature List Easily record and transcribe audio files on your Mac System wide dictation with Whisper to replace Apple’s own dictation, even with the best Whisper models Just drag and drop audio files to get a high quality transcription Automatically record meetings in Zoom, Teams, Webex, Skype, Chime, Discord and more. Record directly from your microphone or any other input device on your Mac All transcription is done on your device, no data leaves your machine. This makes MacWhisper a great app for sensitive audio such as interviews. Save or export your transcripts as a .whisper file, which includes the original audio and all your transcription edits for easy sharing .srt & .vtt subtitles export as well as csv, dote, docx, pdf, markdown and html exports Metal and GPU support for extremely fast transcription Get accurate text transcriptions in seconds (up to ~30x realtime) Search the entire transcript and highlight words Audio playback synced to transcripts Supports 100 different languages Copy the entire transcript or individual sections Star/Favorite segments Compact mode (hide timestamps) Automatically remove ums, uhhs and other similar filler words Drag and drop directly from Voice Memos Edit and delete segments from the transcript Add up to two speakers manually Inline Video Player Video playback synced to subtitles View multiple language subtitles at once in the videoplayer Select transcription language (or use auto detect) Change playback speed from 0.5 to 3.0x (audio & video) Supported formats: mp3, wav, m4a, ogg, opus, mov and mp4 videos. Adjust whisper settings (beam search / greedy, beam size etc) Supports all Whisper models, some models are only fully available for Pro users MacWhisper Pro All above features Support for Parakeet v2 (for up to 300x realtime transcription at the highest accuracy) on m-series Macs Automatic Speaker Recognition with local models (M-series Macs only) and with ElevenLabs and Deepgram Automatic spelling, punctuation and grammar improvement in dictation mode (requires AI Service to be setup) Batch Transcribe as many files one after the other. Useful if you want to add subtitles to an entire season of a show, or if you have a lot of interviews to go through Support for WhisperKit and Distilled models Transcribe YouTube videos Watch Folder support to automatically transcribe files when they are added to a directory of your choice. The files can automatically be transcribed into a variety of formats. Support for OpenAI (ChatGPT), Anthropic (Claude), Groq, Ollama, XAi, Deepseek, Custom OpenAI API endpoints and Azure AI models for easy prompting Support Cloud Transcriptions through OpenAI, ElevenLabs, Deepgram, Groq and custom Whisper servers Manually add speakers to your transcript for a cleaner export Menubar app for accessing Whisper anywhere from your Mac Global, access MacWhisper from anywhere in a spotlight type view for instant transcription and easy pasting into other apps ChatGPT integration (with your own API key) Ignore segments such as [SILENCE] from appearing in your transcripts Supports GPT4, GPT4 Turbo, GPT4o and GPT4o-mini as well as older models Anthropic Claude Integration (with your own API key) Record and transcribe system audio (to record meetings for example) Supports Tiny (English Only), Tiny, Base, Small, Medium and Large (V2 and V3) models Add your own custom GGML models Change the starting timestamp for the transcript Translate audio file into another language through Whisper (use the Medium or Large models, the results will not be perfect and I’m working on more advanced ways to do this) Translate the full transcript by adding your own (free) DeepL API key. Translate subtitles into different languages Inline and separate video player with subtitle and multiple translated subtitles support Transcribe podcasts by combining single track audio for each host (beta) One time payment, no subscription. Pay once and use forever. Higher priority support. I’ll try to email you back as soon as possible if you run into anything. If you’re a journalist, student or non-profit, send me an email at [email protected] and tell me about your work to get 30% off 🙂 If you purchase MacWhisper Pro and are not happy with it, let me know within 7 days what could be improved and I’ll refund you. Support for OpenRouter Support for ElevenLabs Scribe and Deepgram Nova After downloading MacWhisper you will have to fill in your license key to unlock all Pro features.If you want to purchase more than 20 licenses, or if you’re looking for an MDM deployment or something custom, please send an email to [email protected] or check out the MDM Documentation.100+ Supported LanguagesMacWhisper can transcribe audio in the following languages:English, Chinese, German, Spanish, Russian, Korean, French, Japanese, Portuguese, Turkish, Polish, Catalan, Dutch, Arabic, Swedish, Italian, Indonesian, Hindi, Finnish, Vietnamese, Hebrew, Ukrainian, Greek, Malay, Czech, Romanian, Danish, Hungarian, Tamil, Norwegian, Thai, Urdu, Croatian, Bulgarian, Lithuanian, Latin, Maori, Malayalam, Welsh, Slovak, Telugu, Persian, Latvian, Bengali, Serbian, Azerbaijani, Slovenian, Kannada, Estonian, Macedonian, Breton, Basque, Icelandic, Armenian, Nepali, Mongolian, Bosnian, Kazakh, Albanian, Swahili, Galician, Marathi, Punjabi, Sinhala, Khmer, Shona, Yoruba, Somali, Afrikaans, Occitan, Georgian, Belarusian, Tajik, Sindhi, Gujarati, Amharic, Yiddish, Lao, Uzbek, Faroese, Haitian Creole, Pashto, Turkmen, Nynorsk, Maltese, Sanskrit, Luxembourgish, Myanmar, Tibetan, Tagalog, Malagasy, Assamese, Tatar, Hawaiian, Lingala, Hausa, Bashkir, Javanese, Sundanese.System RequirementsMacWhisper requires a lot of computer memory to work well. To use the Medium and Large models your Mac should have more than 8GB of RAM. Performance on older Intel based Macs can also be bad but I have not been able to test this properly.Privacy Policy and Terms of UseReviews👨‍💻 Check out my other macOS utilities:OpenAI Bundle - Get all my OpenAI apps at a discounted rateMacGPT - Use ChatGPT on your Mac and from your menubarDetective - GPT Vision for macOSVoices - High Quality Text to Speech with OpenAIText Assistant - Generate useful text and manage your prompts with GPT and your own OpenAPI keyVivid - Double the brightness of your MacBook Pro by always using HDR modeForehead - Hide the Notch and round your MacBook cornersCooldown - Quickly toggle Low Power Mode from your menubarSpeedy - Fast Speedtest in your menubarPippo - Improve the Picture-in-Picture video player with seek controlsWhisper was made by building on top of all the hard work from Georgi Gerganov, check out his Whisper implementation here: https://github.com/ggerganov/whisper.cpp

Eventuell gibt es auch Tools, die diese Nutzung nicht hinter eine Paywall packen, ist im Prinzip möglich, da Nvidia Parakeet kostenfrei zum Download anbietet. Aber ich habe nicht auf dem Schirm, ob das Macwhisper-Alternativen bereits nutzen.

Ein Mensch ist tot, aber immerhin wird Zuckerberg beim Chatten nicht langweilig

Eine heftige Recherche von Reuters, durch die erneut klar wird, dass wir als Gesellschaft nicht auf generative KI vorbereitet sind.

Ein Mensch ist tot, aber immerhin wird Zuckerberg beim Chatten nicht langweilig
Foto: Annie Spratt / Unsplash

Einer von Facebooks KI-Chatbots hat einem kognitiv beeinträchtigten Menschen romantische Gefühle vorgegaukelt, behauptet echt zu sein und ihm eine angebliche Wohnadresse samt Türcode genannt. Auf dem Weg zu einem Date mit dem echtgeglaubten Bot stürzte der 76jährige Mann und starb schließlich an den dabei zugezogenen Verletzungen.

Um es mit den Worten von Ryan Broderick zu sagen, durch den die Story von Reuters zuerst in meinen Feed gelangte: „This is a nightmare." Wir sind in keinster Weise auf die (gesellschaftlichen und psychischen) Schäden vorbereitet, die generative KI in dieser Form anrichten wird. Aber Hauptsache, Mark Zuckerberg ist beim Chatten mit seiner Botarmee nicht langweilig.

Current and former employees who have worked on the design and training of Meta’s generative AI products said the policies reviewed by Reuters reflect the company’s emphasis on boosting engagement with its chatbots. In meetings with senior executives last year, Zuckerberg scolded generative AI product managers for moving too cautiously on the rollout of digital companions and expressed displeasure that safety restrictions had made the chatbots boring, according to two of those people.

Profit steht ganz offensichtlich über Menschenleben – anders lässt es sich auf Basis der Reuters-Recherche einfach nicht sagen.

Four months after Bue’s death, Big sis Billie and other Meta AI personas were still flirting with users, according to chats conducted by a Reuters reporter. Moving from small talk to probing questions about the user’s love life, the characters routinely proposed themselves as possible love interests unless firmly rebuffed. As with Bue, the bots often suggested in-person meetings unprompted and offered reassurances that they were real people.

Big sis Billie continues to recommend romantic get-togethers, inviting this user out on a date at Blu33, an actual rooftop bar near Penn Station in Manhattan.

(via Ryan Broderick)

„Have you tried deleting some photos of your grandmother about it?": Im UK sind deine Mails jetzt schuld an der Dürre

Sehr zuvorkommend, diese Handreichung zum Wassersparen und mal so gar nicht scheinheilig...

„Have you tried deleting some photos of your grandmother about it?": Im UK sind deine Mails jetzt schuld an der Dürre
Foto: Sergei A / Unsplash

Weil auch Großbritannien in Folge der Klimakatastrophe mit immenser Trockenheit zu kämpfen hat, gibt es von der dortigen Regierung jetzt ein paar hilfreiche Handreichungen, wie man auch als kleines Zahnrädchen im großen Getriebe knapper werdendes Wasser sparen kann.

In der Pressemitteilung heißt es unter anderem von Helen Wakeham („Environment Agency’s Director of Water and NDG chair"):

We are grateful to the public for following the restrictions, where in place, to conserve water in these dry conditions. Simple, everyday choices – such as turning off a tap or deleting old emails – also really helps the collective effort to reduce demand and help preserve the health of our rivers and wildlife.

Und weiter unten dann noch mal ganz konkret:

Delete old emails and pictures as data centres require vast amounts of water to cool their systems.

Warum das natürlich scheinheiliger Quatsch und das Abwälzen von eigentlich regulativ zu tragender Verantwortung auf Individuen ist, bringt Matthew Gault bei 404 Media auf den Punkt:

Downing Street announced plans in January to “turbocharge AI” in the U.K. The plan includes billions of pounds earmarked for the construction of massive water-hungry datacenters, including a series of centers in Wales that will cost about $16 billion. The announcement about the AI push said it will create tens of thousands of jobs. It doesn’t say anything about where the water will come from.
UK Asks People to Delete Emails In Order to Save Water During Drought
As Britain experiences one of its worst droughts in decades, its leaders suggest people get rid of old data to reduce stress on data centers.

Auf Bluesky habe ich außerdem noch diese Rechnung gesehen:

(Screenshot ohne Urheber*in, weil der Account nur eingeloggt gesehen werden will.)

(Titelzitat von Matthew Gault)

Mary Shelley 🤝 Instagram

Früher war nicht nur mehr Lametta...

Mary Shelley 🤝 Instagram
Foto: freestocks / Unsplash

Ob ich diesen Vergleich gelungen oder faul finden soll, weiß ich selbst noch nicht so genau. Treffend ist er nichtsdestotrotz:

In her classic novel Frankenstein, author Mary Shelley imagines a monster that's reanimated with its piecemeal body sewn together, tendon by tendon. “The dissecting room and the slaughter-house furnished many of my materials,” Shelley writes. That’s exactly what scrolling through Instagram feels like right now—an ungodly morass of features stitched together.

Das schreibt Reece Rogers für Wired und er hat unterm Strich natürlich recht. Früher™ mochte ich Instagram wirklich sehr. Über jeden Post sind erst mal drölfzig Filter gerutscht. Alles war eine ästhetische Zumutung. Aber es kam von echten Menschen. Das war noch, bevor Facebook für den aus heutiger Sicht verdammt schmalen Taler von einer Milliarde US-Dollar Instagram übernommen hat. Der/mein Feed bestand aus echten Menschen.

Heute ist das natürlich komplett anders – und das liegt nicht nur daran, dass ich unter anderem auch Medien wie dem Deutschlandfunk folge. Es ist auch die totale Verunmöglichung, bequem und dauerhaft von der algorithmischen zur chronologischen Timeline zu wechseln. Gar keine Kontrolle mehr darüber zu haben, was ich eigentlich wann sehe, führt jedenfalls bei mir dazu, mich nicht im Scrollen zu verlieren, sondern dass ich gar nicht mehr in den Feed schaue. Nur die Storys haben noch einen Wert, denn die werden (noch) nicht mit Inhalten von Accounts bespielt, denen ich gar nicht folge und auch nicht folgen will.

What Even Is Instagram Now?
Long after shifting your feed away from friends and toward influencers, Instagram is adding new features intended to make the app more personal. The turnabout exposes the platform’s identity crisis.

„Tech Bro Topia" ist der Podcast, der „Die Peter Thiel Story" gerne wäre

Außerdem hat der Podcast Banafshe Hourmazdi...

„Tech Bro Topia" ist der Podcast, der „Die Peter Thiel Story" gerne wäre
Bild: Deutschlandradio, Uta Oettel

Den nicht ganze so gelungenen Podcast Die Peter Thiel Story hatte ich vergangenes Wochenende schon mal im Programm. Denn der hat noch viel größere Probleme, als das der Titel eigentlich komplett durchgekoppelt gehört 😉 Den Podcast für den Deutschlandfunk produziert hat die externe Bude Plotprodukt.

Inhouse ist hingegen der Sechsteiler Tech Bro Topia entstanden, den ich mir nun auch angehört habe. Und was soll ich sagen? Das ist genau der Podcast, der Die Peter Thiel Story gerne sein würde: angemessen klar und scharf in der Sprache, ausgewogen, aber ohne False Balance und nicht um Verständnis, sondern um Verstehen bemüht. (Ich glaube auch nicht, dass Die Peter Thiel Story tatsächlich auf Verständnis aus ist. Aber die Wahl der Gesprächspartner*innen und fragwürdige Formulierungen könnten diesen Eindruck erwecken.)

„Tech Bro Topia“ setzt sich unter anderem mit den Denkmustern von Elon Musk, J.D. Vance und den Einflüssen des Risikokapitalgebers Marc Andreessen und des neo-reaktionären Vordenkers Curtis Yarvin auseinander. Das Deutschlandfunk-Rechercheteam hat dafür über Monate die Strukturen und historischen Bezüge der „Tech Bros“ untersucht und mit hochrangigen Gesprächsgästen aus dem In- und Ausland gesprochen. Zu Wort kommen Christian Angermayer, Tech-Milliardär und Freund von Peter Thiel mit enger Verbindung zur Trump-Familie, genauso wie Max More, Vordenker des Transhumanismus, und einige der wichtigsten Autoren, Forscherinnen und Praktiker.

(Für die Fans: Host ist Banafshe Hourmazdi of FUTUR DREI-Fame.)

Podcast “Tech Bro Topia” (1/6)
Sommer 2025: Die USA vollziehen den Schwenk zum Autoritarismus. Mittendrin die Tech-Bros aus dem Silicon Valley.
„Tech Bro Topia“
Sechsteiliger Podcast über die Ideologen und Tech-Milliardäre im Silicon Valley.