Connect with us

Künstliche Intelligenz

DeepSeek-OCR: Wie Bilder Chatbots helfen, lange Gespräche zu führen


Chinesische KI-Forscher wollen mithilfe von Bildern erreichen, dass Chatbots auch bei Gesprächen mit großer Vorgeschichte schnell und günstig bleiben. Mithilfe optischer Kontextkompression könnten die KI-Assistenten deutlich besser werden, zeigen sich die Entwickler von DeepSeek-OCR überzeugt. Das Modell hat aktuell experimentellen Status. Trotz zehnfacher Kompression habe man aber bereits eine Genauigkeit von 97 Prozent nachweisen können.

Weiterlesen nach der Anzeige

Das Problem bei heutigen KI-Chatbots ist, dass sie bei jeder Antwort die komplette Historie neu verarbeiten müssen. Bei der optischen Kompression wird der Gesprächsverlauf stattdessen als Bild gespeichert und benötigt weniger Token bei der Verarbeitung. Statt 1000 Token würden etwa nur 100 benötigt. Dies ermögliche zehnfach schnellere Antwortzeiten. Hilfreich wäre das auch bei der Verarbeitung langer PDF-Dokumente.

Per OCR (Optical Character Recognition) werden die Bilder von der KI bei Bedarf wieder in Texte umgewandelt. Allerdings geht der Ansatz von DeepSeek weit über klassische OCR hinaus. Das System kann nicht nur Text erkennen, sondern auch Diagramme in Excel-taugliche Tabellen umwandeln, chemische Formeln in maschinenlesbare SMILES-Formate konvertieren und geometrische Figuren analysieren. Zudem beherrscht es fast 100 Sprachen in einem einzigen Modell.

Die Entwickler von DeepSeek haben dabei auch mit verschiedenen Auflösungen gearbeitet und die Idee entwickelt, mit den unterschiedlichen Schärfegraden das menschliche Gedächtnis nachzuahmen. Zeitlich nur kurz zurückliegende Kontexte könnten in höherer Auflösung gespeichert werden und wären damit der KI schärfer im Gedächtnis. Weiter zurückliegende Erinnerungen würden aufgrund niedrigerer Auflösungen zunehmend verblassen.

Weiterlesen nach der Anzeige

Für die praktische Anwendung hat DeepSeek umfangreiche Trainingsdaten zusammengestellt: 30 Millionen PDF-Seiten in rund 100 Sprachen, 20 Millionen Bilder natürlicher Szenen sowie Millionen synthetische Samples für Diagramme, Chemieformeln und geometrische Figuren. In der Produktion kann das System bereits heute über 200.000 Seiten pro Tag verarbeiten – mit nur einem älteren Nvidia-Beschleuniger vom Typ A100. Das macht es interessant für Massendatenverarbeitung, etwa bei Versicherungen, Behörden oder Verlagen.

Die Forscher selbst bezeichnen DeepSeek-OCR in ihrem Paper als „vorläufige Erkundung“ und benennen offene Fragen. Wie verhält sich das System zum Beispiel bei der Suche nach der „Nadel im Heuhaufen“ („Needle-in-a-Haystack“-Tests), wenn spezifische Infos aus sehr langen Kontexten gesucht werden?

DeepSeek erprobt damit einen andersartigen Architektur-Ansatz für KI. Die chinesische KI-Schmiede bemüht sich schon seit einiger Zeit, ein Gegengewicht zu den US-KI-Firmen wie OpenAI, Google oder Anthropic aufzubauen, die primär auf Skalierung setzen. Der Code von DeepSeek-OCR steht samt Modellgewichten auf GitHub zum Download bereit und kann von Interessierten ausprobiert werden.


(mki)



Source link

Künstliche Intelligenz

Unter 100 Gramm: Neuer Chip ermöglicht besonders leichte VR-Brillen


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Ehemalige Apple- und Meta-Ingenieure haben einen Koprozessor vorgestellt, der die Sensordatenverarbeitung für Passthrough, räumliches Tracking sowie Blick- und Gestenerfassung mit niedriger Latenz und geringem Energieverbrauch übernimmt. Damit ließe sich der Hauptprozessor in einen kabelgebundenen Taschencomputer verlagern, berichtet UploadVR. Wird auch der Akku ausgelagert, ermögliche dies Mixed-Reality-Brillen, die deutlich kompakter und leichter sind. Leichter sogar als die bislang kleinste VR-Brille der Welt.

Weiterlesen nach der Anzeige

Zur Demonstration des Konzepts präsentierte das chinesische Start-up GravityXR die Mixed-Reality-Brille M1, ein Referenzdesign, das unter 100 Gramm wiegt und Drittherstellern als Blaupause dienen soll. Zum Vergleich: Meta Quest 3 hat sämtliche Komponenten integriert und bringt über 500 Gramm auf die Waage, während Apple Vision Pro jenseits der 600 Gramm wiegt und über eine externe Batterie betrieben wird. Das M1-Referenzdesign verfügt über zwei 2,5K-OLED-Mikrodisplays und Pancake-Linsen mit einem Sichtfeld von 90 Grad. Hinzu kommen vier Trackingkameras sowie zwei Passthrough-Kameras.

Der Koprozessor G-X100 unterstützt bis zu zwei 4K-Displays mit 120 Hertz, zwei Farb-Passthrough-Kameras mit bis zu 16 Megapixeln, Reverse Passthrough (das gleiche Displayprinzip, das Apples EyeSight zugrunde liegt) sowie Blick- und Gestenerfassung. Das gelingt mit einem Energieverbrauch ab 3 Watt, der eine passive Kühlung ohne schweren Kühlkörper oder Lüfter ermöglicht. Die Sensordaten verarbeitet der Chip mit einer Latenz von 9 Millisekunden. Der bisherige Rekordhalter, Apple Vision Pro, kommt auf 12 Millisekunden.

Am G-X100-Chip wirkten frühere Apple-Ingenieure mit, die bereits den auf Sensordatenverarbeitung spezialisierten R1-Chip der Apple Vision Pro entwickelt haben. Bei der Präsentation des G-X100 wurden noch keine Produkte auf Basis des neuen Chips angekündigt, doch das könnte sich in den kommenden Jahren ändern. Gerade, wenn ultraleichte Split-Designs mit Taschencomputer zunehmend an Bedeutung gewinnen.

Nachdem herkömmliche Standalone-Headsets nicht den erwünschten Durchbruch gebracht haben, versuchen sich die Hersteller demnächst an neuen Formfaktoren. Berichten zufolge plant Meta für nächstes Jahr eine besonders leichte Mixed-Reality-Brille mit kabelgebundenem Taschencomputer. Auch Konkurrent Pico arbeitet an einem leichtgewichtigen Gerät, das schon in der ersten Jahreshälfte erscheinen könnte, und hat dafür einen Koprozessor entwickelt, der dem G-X100 und Apples R1-Chip ähnelt. Pico-Eigentümer ByteDance zählt zu den Investoren des Start-ups GravityXR.

Das Unternehmen hat neben dem G-X100 auch einen Chip für Smart Glasses vorgestellt, der Fotos mit 16 Megapixel sowie Videoaufnahmen in 4K mit 30 Bildern pro Sekunde liefert, berichtet die chinesische Webseite VR Tuoluo. Er kann damit, zumindest auf dem Papier, bessere Fotos und Videos schießen als die zweite Generation der Ray-Ban Meta-Brille.

Weiterlesen nach der Anzeige


(tobe)



Source link

Weiterlesen

Künstliche Intelligenz

Drastischer Umbau von Apples Führungsspitze geht weiter


close notice

This article is also available in
English.

It was translated with technical assistance and editorially reviewed before publication.

Der Umbau von Apples Konzernspitze setzt sich im Rekordtempo fort: Nach dem Abgang des KI-Chefs und des Interface-Design-Chefs wird die für Umwelt und soziale Initiativen verantwortliche Spitzenmanagerin Lisa Jackson den Konzern verlassen. Jackson, einst Chefin der US-Umweltschutzbehörde EPA unter Präsident Obama, hat die Themen Klimaschutz und erneuerbare Energien bei Apple erheblich vorangetrieben und gilt als Architektin des Projektes „Apple 2030“. Das selbst gesteckte Ziel des Unternehmens ist, zum Jahr 2030 klimaneutral zu arbeiten – mitsamt der kompletten Lieferkette.

Weiterlesen nach der Anzeige

Ihre Position gibt es künftig offenbar nicht mehr: Die von Jackson geleitete Sparte wird Ende Januar aufgeteilt, wie Apple in der Nacht auf Freitag mitteilte. Die für Umwelt und soziale Initiativen zuständigen Teams sind künftig dem Lieferketten- und Logistik-Chef unterstellt – und nicht länger direkt Apple-Chef Tim Cook.

Den für Apple immer zentraleren Bereich „Government Affairs“, der Lobbyarbeit und den Austausch mit staatlichen Stellen umfasst und der bislang ebenfalls bei Jackson lag, leitet künftig Apples Chefjustiziarin. Diese wechselt der Konzern parallel ebenfalls aus: Die bislang öffentlich kaum in Erscheinung getretene Juristin Kate Adams tritt im kommenden Jahr den Ruhestand an. Ihre Position als Apples „General Counsel“ bekleidet ab März 2026 der Neuzugang Jennifer Newstead, so das Unternehmen. Sie war zuvor bei Meta als Chefjuristin tätig. Während der ersten Regierung Trump diente Newstead als Chefjuristin des US-Außenministeriums (Legal Adviser of the Department of State).

Apples Top-Management befindet sich im größten Umbruch seit Jahrzehnten. Auch die Gerüchte über einen nahenden Wechsel an der Spitze und eine Nachfolge von CEO Tim Cook sind jüngst wieder hochgekocht. Apples Hardware-Technik-Chef Johny Srouji – der für die Chip-Entwicklung zuständig ist –, lote zudem seine Optionen aus, hieß es jüngst. Die Positionen COO und CFO hat Apple in diesem Jahr bereits neu besetzt.

Auf den unteren Ebenen scheint es ebenfalls auffällig viele Abgänge zu geben, allein Apples KI-Sparte verlor Berichten zufolge in den vergangenen Monaten zahlreiche wichtige Mitarbeiter – unter anderem an Meta. Unter den Hardware-Ingenieuren und Designern habe der Konzern Dutzende Spezialisten verloren, die offenbar zu OpenAI gegangen sind, wie das Wall Street Journal berichtet.

Weiterlesen nach der Anzeige


(lbe)



Source link

Weiterlesen

Künstliche Intelligenz

Jetzt noch schnell buchen: Jubiläumsangebot von heise security PRO endet bald


Seit dem 22. Juni 2020 gibt es mit heise security PRO ein etwas anderes heise-Angebot speziell für IT-Sicherheitsverantwortliche. Aus der fixen Idee des Gründers Jürgen Schmidt wurde eine Gemeinschaft mit fast 1.000 Security-Profis aus dem gesamten deutschsprachigen Raum. Sie tauschen sich auf Veranstaltungen und online aus und bilden sich gemeinsam weiter. Noch immer mittendrin: Der Gründer.

Weiterlesen nach der Anzeige

Verstärkung bekam Jürgen im Herbst 2023 durch Christopher Kunz – den Autor dieses Textes. Gemeinsam entwickeln wir Plattform und Inhalte weiter, planen Vorträge und Webinare und schreiben den allwöchentlichen Newsletter. Hinter den Kulissen sorgt der Pro-Support für reibungslose Abläufe und das Event-Team kümmert sich um alle Veranstaltungen, ob live vor Ort oder als Webinar.

Der heise security PRO Newsletter liefert unsere Analysen, Einschätzung und Empfehlungen jeden Donnerstag um 15:04 in die Mailboxen unserer Mitglieder. Die inhaltliche Spannweite reicht dabei von Malware und Cybercrime über neue Sicherheitslücken bis zu Empfehlungen zur Absicherung von Windows-Servern. Uns ist ein Inhalts-Mix wichtig, der nicht nur CISOs abholt, sondern auch ihren Kollegen, die ganz praktisch die neuesten Sicherheitsrichtlinien und Best Practices umsetzen müssen.

Das Feedback zum Newsletter gibt dem Konzept recht: Er hat sich zur Pflichtlektüre für Sicherheitsverantwortliche und Techniker entwickelt, der neue Anstöße gibt und auch mal die Luft aus einem Security-Hype herauslässt. Wer Neues aus der Welt der IT-Sicherheit lieber mit den Ohren konsumiert, hört als Mitglied von heise security PRO zudem „Passwort“, den heise-security-Podcast, bereits zwei Tage vor der Veröffentlichung.

Die Gründung von heise security PRO fiel ins erste Corona-Jahr – Vor-Ort-Veranstaltungen litten extrem unter den pandemiebedingten Einschränkungen. Online-Konferenzen erwiesen sich für uns rasch als probater Ersatz und sind seitdem fester Bestandteil der Tour (die sich dieses Jahr zum zwanzigsten Mal jährte!). Zum Glück können wir mittlerweile wieder Events vor Ort anbieten und tun das auch dreimal jährlich. Die Tourtermine sind mittlerweile eine Art „Familientreffen“ der Community von heise security PRO geworden, die sich mit sechs Fachvorträgen auf den neuesten Stand bringt. Am Rande der Konferenz bleibt reichlich Zeit zum Fachsimpeln und nach dem letzten Vortrag gibt es ein kühles Getränk mit den Redakteuren und Experten.

Abseits der Konferenz planen wir jährlich mehrere Webinare zu verschiedenen Security-Themen. Auch hier gilt unsere redaktionelle Maxime: Wir wollen die besten Experten, die kompetent, unabhängig und ohne Werbe-Auftrag informieren – der Platz auf der heise-security-Bühne lässt sich nicht kaufen. In diesem Jahr waren das Opensource-SIEM Wazuh, der Dauerbrenner Windows-Security und „NIS-2 kommt – rechtskonforme IT-Sicherheit umsetzen“, das in knapp einer Woche stattfindet, nur einige der Webinarthemen. Der Zugang zu allen heise-security-Webinaren ist für PRO-Mitglieder kostenlos; sie stehen ihnen danach auch zeitlich unbegrenzt als Aufzeichnung in der PRO-Mediathek zur Verfügung – bequem zum Selbststudium.

Weiterlesen nach der Anzeige

Nicht nur auf der Security Tour und in Webinaren, sondern auch während unserer Community-Veranstaltungen suchen wir das Gespräch mit unseren Mitgliedern. Einmal im Monat – mit seltenen Ausnahmen etwa in der Feriensaison – treffen wir uns zu einer Online-Podiumsdiskussion, dem PRO-Talk. Ursprünglich hatte Jürgen dabei etwas in der Art von Reddits „Ask Me Anything“ im Sinn, hat das Konzept aber mittlerweile weiter verfeinert. Ein ausgewiesener Experte gibt im PRO-Talk einen kurzen Themen-Impuls von zehn bis 15 Minuten. Danach diskutieren die Mitglieder untereinander, mit dem Experten und uns von der Redaktion über verschiedene Aspekte des Gehörten. Die Themen der PRO-Talks rangieren von Erfahrungsberichten nach IT-Vorfällen über Einblicke in neue Technologien wie homomorphe Verschlüsselung bis hin zu Handreichungen für die tägliche Arbeit. Auch offene Fragen wie die nach der Wirksamkeit von Phishing- und Awareness-Übungen thematisieren wir in unseren Gesprächsrunden.


Oberfläche der heise security PRO community

Oberfläche der heise security PRO community

Diskussionen, Mediathek und Terminkalender für heise security PRO finden unsere Mitglieder in der Community-Oberfläche.

(Bild: heise security PRO / cku)

Die täglichen Fragen im IT-Sicherheitsalltag, aber auch alles andere diskutieren wir im PRO-Forum. Dort können die Security-Spezialisten neue Werkzeuge empfehlen, Kniffe zur Absicherung von Servern und Clients austauschen und auch mal Literaturempfehlungen für die Abendlektüre abholen. Alles in einem geschützten Rahmen: Die Chatham House Rule besagt, dass Mitglieder alles in unserer Community Gehörte zwar nutzen, ihre Gesprächspartner aber nicht gegenüber Dritten identifizieren dürfen. So ermöglichen wir offene Gespräche und vermeiden Compliance-Probleme.

Die Foren dienen auch als Q&A-Bereich nach einem Webinar – die Dozenten beantworten weitere Fragen und diskutieren mit der Community. So etwa beim Wazuh-Webinar und auch Karsten M. Bartels, der Dozent des oben genannten NIS-2-Webinars wird die nächsten Schritte mit den PRO-Mitgliedern erörtern. Denn: Womöglich noch in diesem Jahr tritt das NIS2-Umsetzungsgesetz in Deutschland in Kraft.

Anlässlich des Jubiläums bieten wir noch bis Jahresende Neueinsteigern ein deutlich vergünstigtes Angebot: Statt des regulären Preises von 1125 Euro pro Jahr kostet die Mitgliedschaft derzeit nur 995 Euro im ersten Jahr (beide Preise inklusive 19 Prozent Mehrwertsteuer). Wer nachrechnet, stellt schnell fest: Das ist ein Paketpreis, der sich lohnt. Nutzt man nur drei bis vier der Inklusiv-Angebote, etwa die Security Tour, secIT und zwei Webinare, ist man gegenüber der Summe der Einzelpreise schon im Plus. Die zusätzlichen Leistungen, also etwa unsere Community-Veranstaltungen, das heise+- und heise-pur-Abo gibt es kostenlos obendrauf.




(cku)



Source link

Weiterlesen

Beliebt