Skip to content
Kategorie Technologik

Geigenautomat spielt Chopin

Wenn man nun auch >ernsthaft< Stücke der Neuen Musik, Ferneyhough, Sciarrino et al da spielen könnte, was wäre das.

(via Erik)

Mit 1$-Gitarre rocken

(via Neatorama)

Stimm-Font aus Aufnahme erstellen

Die Software Lyrebird behauptet, sie könne aus nur einer Minute Stimmaufzeichnungen jegliche Formulierung und Intonation simulieren:
„Record 1 minute from someone’s voice and Lyrebird can compress her/his voice’s DNA into a unique key. Use this key to generate anything with its corresponding voice“.

Lyrebird will offer an API to copy the voice of anyone. It will need as little as one minute of audio recording of a speaker to compute a unique key defining her/his voice. This key will then allow to generate anything from its corresponding voice. The API will be robust enough to learn from noisy recordings. The following sample illustrates this feature, the samples are not cherry-picked.

Die Probleme, die das reibungslose Kopieren von Stimmen mit sich bringt, liegen auf der Hand und die InfoSec-Bruhahas sind nur die offensichtlichsten davon:

Researchers at the University of Alabama, Birmingham, led by Nitesh Saxena, were able to use Festvox to clone voices based on only five minutes of speech retrieved online. When tested against voice-biometrics software like that used by many banks to block unauthorised access to accounts, more than 80% of the fake voices tricked the computer. Alan Black, one of Festvox’s developers, reckons systems that rely on voice-ID software are now “deeply, fundamentally insecure”.

Die Entwickler von Lyrebird sind sich der Probleme ihrer Technologie bewusst, Snip von der Ethics-Section ihrer Website:

Voice recordings are currently considered as strong pieces of evidence in our societies and in particular in jurisdictions of many countries. Our technology questions the validity of such evidence as it allows to easily manipulate audio recordings. This could potentially have dangerous consequences such as misleading diplomats, fraud and more generally any other problem caused by stealing the identity of someone else.

By releasing our technology publicly and making it available to anyone, we want to ensure that there will be no such risks. We hope that everyone will soon be aware that such technology exists and that copying the voice of someone else is possible. More generally, we want to raise attention ab

Ob das nun scary ist oder nur ein im Grunde bekannter Gag, wie seit jeher Stimmimitatoren ihren Ulk betreiben, we’ll see. Verbunden mit der Lippensync-Technik könnte es schon ein weiterer Schritt sein in die Ununterscheidbarkeit von Realität und Fiktion.

(via Nerdcore)

Reverse Face Cognition

Two pix2pix GANs, one that generates face markers from faces, the other that generates faces from face markers are set up in a feedback loop and generate an infinite stream of uncanny faces.
This is a little test that shows the limits of my trained face generation model. Left is the original trailer, on the right is the result of a combination of two pix2pix models, the first tries to find face markers, the second one tries to generate faces from the found markers. As you can see there is no threshold – the model will try to find and generate faces even if there are none in the source.

Wäre zu überlegen, wie man das >künstlerischer< und in Musik bringen kann, also wie diese Gegenüberstellung im anderen Medium ginge, und die Technik sowieso.

(via Nerdcore)

Lippenbewegungen faken

Multimedia impliziert immer die Frage der Synchronizität von Bild und Ton. Kunst wie Hackertum greift da natürlich in den Konnex ein. In meinem Vokalessay “Lippenstift” ist das Thema.
Wissenschaftler der University of Washington haben ein Verfahren vorgestellt, mit dem die Lippenbewegungen eines Videos an einen alternativen Text angepasst werden können. So lassen sich Wörter in den Mund legen, die an anderer Stelle geäußert wurden.

In einem Video demonstrieren die Forscher das Resultat: Barack Obama spricht in ein und derselben Videoaufnahme mal über die Krankenversicherung, mal über Terroranschläge, mal über seine Einstellung zur US-amerikanischen Vielfalt. Die Lippenbewegungen passen sich dem Gesagten so an, dass das Resultat zumindest auf den ersten Blick glaubhaft erscheint. Ganz lebensecht sind die Fake-Speech-Videos zwar noch nicht, bei flüchtigem Hingucken aber trotzdem überzeugend.

https://www.heise.de/newsticker/meldung/Fake-Speech-KI-hilft-beim-Aendern-von-Lippenbewegungen-3770821.html?wt_mc=rss.ho.beitrag.atom

Der Pottwal – Eines der lautesten Tiere der Welt

Posaune in der Spracherkennung

(via username)

Audioklammer

(via Grütze)

Festival sendet Musik in den Weltraum

Vielleicht hätten’s ein paar Konzepte für die Aliens auch getan.

(via kfm)

Saxofon ohne Saxofon spielen

(via Neatorama)