Comment les téléphones portables vont évoluer avec Galaxy AI, Apple Intelligence et d’autres IA génératives

-

Avec l’intégration de l’intelligence artificielle (IA) générative, nous entrons dans une nouvelle ère dans la façon dont nous interagissons avec ces appareils, en plus de nous rendre plus productifs grâce à des équipements compacts et puissants.

Selon les critères de

Il est important de préciser que l’IA est présente sur nos appareils mobiles depuis longtemps, dans de nombreuses applications que nous utilisons. Cependant, nous sommes désormais confrontés à un nouveau sous-ensemble : l’intelligence artificielle générative, également connue sous le nom de GAI ou « gene AI » (en anglais).

Selon l’entreprise technologique IBM, l’IA générative est capable de « créer du contenu original, tel que du texte, des images, de la vidéo, de l’audio ou du code logiciel, en réponse aux instructions ou à la demande d’un utilisateur ».

Parmi les IA génératives les plus connues au monde figurent :

  • ChatGPT
  • DALL-E
  • Diffusion stable
  • À mi-parcours

De grandes entreprises leaders sur le marché, comme Samsung et Apple, sont à l’avant-garde de cette révolution, en implémentant cette technologie dans leurs appareils pour offrir des fonctionnalités nouvelles et plus puissantes.

Par exemple, la société sud-coréenne, en collaboration avec Google, a annoncé Galaxy AI, son ensemble de fonctionnalités basées sur l’IA, en janvier de cette année.

Derrière eux se trouvent des modèles avancés tels que Gemini Pro et Ultra, conçus pour effectuer des tâches complexes. De plus, ils ont implémenté Gemini Nano, une version optimisée de réponse rapide pour les tâches de base, telles que l’interprétation d’images et les résumés.

Cette technologie est déjà une réalité et s’étend aux appareils présents sur le marché depuis un certain temps. Actuellement, Galaxy AI est disponible dans la gamme S du S21 au S24, dans les téléphones pliables du Z Fold3 au Z Fold5 et du Z Flip3 au Z Flip5, en plus des tablettes Galaxy Tabs S8 et S9.

Ce sont quelques-uns des produits du marché colombien qui disposent déjà de Galaxy AI.

Photo:Samsung

Comment les iPhones d’Apple vont-ils évoluer avec l’IA ?

Apple, de son côté, prépare un paquet de nouvelles fonctionnalités basées sur l’IA générative, dont une mise à jour importante de Siri, son assistant virtuel.

Cette mise à jour permettra aux utilisateurs de naviguer entre les documents, photos et e-mails simplement avec des commandes vocales. Ces fonctions, Annoncés sous le nom d’Apple Intelligence le 10 juin dernier lors de la conférence des développeurs de la WWDC, ils seront accessibles au public à l’automne 2024.

Dans son annonce, le PDG d’Apple, Tim Cook, a noté que son approche « combine l’IA générative avec le contexte personnel de chaque utilisateur pour fournir des informations véritablement exploitables. De plus, vous accédez à ces informations de manière totalement privée et sécurisée pour vous aider à faire ce qui compte le plus pour vous.

Capture d’écran de l’émission WWDC 2024 mettant en vedette Tim Cook juste avant de présenter Apple Intelligence.

Photo:Manzana

Fonctionnement et implications de l’IA sur les téléphones portables

Si bien lo que hay detrás de la IA generativa es tan complejo como maravilloso (miles y miles de cálculos en cuestión de segundos, intentando dar la mejor respuesta basada en millones de datos obtenidos de textos, imágenes, códigos y números a la consulta hecha por une personne), L’IA générative n’est pas réservée aux experts en technologie ; Il est conçu pour être accessible à tous. Utilisez simplement un langage ou gribouillis sur l’écran pour y accéder.

En termes générales, L’IA générative dans les téléphones portables s’est concentrée sur l’offre de solutions telles que la correction et l’ajustement des tons dans les textes, les résumés de grands volumes d’informations, l’édition de photographies, la transcription audio et la génération d’« autocollants » ou d’émojis.

De son côté, Samsung a opté pour la traduction en temps réel, en personne et via un appel, et la génération d’images pour convertir une vidéo conventionnelle en vidéo au ralenti.

Mario Laffitte, vice-président des affaires générales pour l’Amérique latine chez Samsung

Photo:Samsung

Mario Laffitte, vice-président des affaires générales pour l’Amérique latine chez Samsung, a débuté sa carrière dans l’entreprise en 2013. Depuis, il a été témoin des innovations de l’entreprise, telles que le lecteur d’empreintes digitales et d’iris, et les écrans pliants.

Lorsqu’on lui a demandé s’il pensait que ces outils d’IA générative atteindraient tous les utilisateurs, quelle que soit la capacité du téléphone portable, il a répondu :

« Non, ce n’est techniquement pas possible car l’intelligence artificielle a besoin de capacités de traitement avancées. Il existe sûrement des modèles de milieu de gamme qui n’auront pas la capacité de répondre à la demande d’intelligence artificielle. en raison de la capacité technique de l’équipe.

Pour cette raison, Les entreprises adoptent une approche combinant native et cloud computing.

Dans le cas de Samsung, comme précisé dans le document du jour de lancement du Galaxy AI, la société utilise les services Google Cloud pour les modèles avancés, chargés de traiter et de générer des textes dans les applications Notes, Voice Recorder et Keyboard de Samsung, et d’éditer les images dans. l’application Galerie.

Alors que les tâches de base sont gérées localement sur l’appareil avec Gemini Nano, comme la transcription de mémos vocaux.

Les implications de cette approche sont importantes. L’informatique native améliore la vitesse et l’efficacité en réduisant la latence et la dépendance à une connexion Internet constante, tandis que le cloud computing vous permet de profiter de modèles d’IA plus puissants et plus complexes sans surcharger le matériel de l’appareil.

Cependant, une question nécessaire se pose : que deviennent nos données ?

Confidentialité des données

La confidentialité des données est une préoccupation majeure dans la mise en œuvre de l’IA générative. Il suffit de voir toute la polémique que Meta, propriétaire entre autres de Facebook et d’Instagram, a suscitée en annonçant qu’elle entraînerait ses modèles avec des images publiées par des utilisateurs en Europe sur leurs réseaux sociaux.

À la suite d’une demande du régulateur irlandais de la protection de la vie privée, la société a suspendu ses efforts, tout en réitérant qu’elle restait « très confiante dans la conformité de notre méthode aux lois et réglementations européennes », réaffirmant ainsi ses projets.

La discussion n’est pas mineure, surtout quand on parle de téléphones portables, ces appareils que nous transportons partout, même aux toilettes, et qui enregistrent toutes nos informations, y compris nos données biométriques lorsque nous les associons à une montre intelligente.

Pour ce faire, Apple a introduit Private Cloud Compute, des serveurs dont le matériel est fabriqué par lui-même, permettant, selon les termes de l’entreprise, “de garantir que les données ne soient jamais conservées ou exposées”.

De son côté, Samsung, via son panneau de configuration, permet à l’utilisateur de choisir de traiter les informations uniquement sur l’appareil. En outre, Pour les entreprises, cela permet via Knox de bloquer certaines fonctionnalités afin que les employés ne puissent pas utiliser l’IA générative basée sur le cloud.

« Nous sommes très attentifs aux enjeux réglementaires internationaux. Même avant l’existence de réglementations spécifiques, nous disposions déjà de protocoles mondialement reconnus, tels que Samsung Knox, qui se concentre sur la sécurité des données au niveau matériel. Les données sont protégées dans la puce Samsung. La couche logicielle de sécurité est appliquée ultérieurement, lors de la transmission des informations. Les données de nos appareils mobiles sont donc sous la protection de Samsung », explique Laffitte.

Les transformations que nous commençons à voir sur le marché

Depuis des années, on parle de batteries, d’appareils photo et de processeurs, notamment en termes de CPU et de GPU, qui déterminent en partie les performances et la qualité graphique.

Avant l’essor de l’IA générative, nous discutions de la technologie de lancer de rayons dans les jeux vidéo, de la manière dont elle améliorait le réalisme à l’écran et de la manière dont ces puissants GPU pouvaient fournir des images plus fluides en augmentant la fréquence d’images par seconde.

Maintenant, Avec l’arrivée de modèles d’IA optimisés pour fonctionner nativement sur les téléphones portables, les unités de traitement neuronal (NPU) deviennent pertinentes.

Les NPU sont des processeurs spécialisés conçus pour exécuter des algorithmes d’apprentissage en profondeur et d’autres tâches d’IA avec une vitesse plus élevée et une consommation d’énergie réduite.

Représentation d’un Snapdragon 8 Gen 3, le processeur que l’on retrouve dans les téléphones portables comme le Samsung Galaxy S24.

Photo:Qualcomm

À l’avenir, il est prévisible que les spécifications techniques des téléphones mobiles incluront des détails sur la capacité de leurs NPU, devenant ainsi une nouvelle norme pour évaluer les performances de ces appareils.

Quel que soit le facteur de forme (qu’il soit pliable, plus large ou allongé), cela pourrait également changer la façon dont nous interagissons, en abandonnant le paradigme tactile et en adoptant la voix.

C’est l’une des promesses d’Apple avec son nouveau Siri : que nous puissions naviguer sur notre appareil, consulter des informations provenant de différentes sources ou effectuer diverses actions dans nos applications simplement en parlant.

Image du lapin R1. En noir, son petit écran. Le cylindre visible à droite est un mécanisme permettant de monter et d'abaisser le méno. Le boîtier en haut est une caméra qui peut pivoter vers l'arrière et vers l'avant.

Image du lapin R1. En noir, son petit écran. Le cylindre visible à droite est un mécanisme permettant de monter et d’abaisser le méno. Le boîtier en haut est une caméra qui peut pivoter vers l’arrière et vers l’avant.

Photo:Lapin

Un appareil qui a également suscité beaucoup d’attention est le Rabbit R1, un petit téléphone portable axé sur l’interaction par la voix. Celui-ci possède un écran de seulement 2,88 pouces et Son système d’exploitation implémente un modèle appelé « Large Action Model », qui peut théoriquement interagir avec des centaines de pages Web et d’applications pour répondre aux demandes des utilisateurs. Cependant, les utilisateurs d’Internet suscitent actuellement de nombreuses critiques.

« Je pense qu’il existe un grand potentiel de développement d’interfaces. Personnellement, je préfère l’interface avec du texte, mais ce n’est que mon avis. Nous sommes très attentifs aux demandes du public et les interfaces vocales deviennent de plus en plus populaires et pratiques. Où sera l’écran dans le futur ? Cela pourrait être dans les verres de nos lunettes, dans les lentilles de contact… Je ne sais pas, mais la fonctionnalité restera cruciale », conclut Laffitte.

Enfin, ce dont on parle peu, mais qui peut marquer le cours de la démocratisation et de l’appropriation de l’IA générative sur les téléphones portables, c’est Qui supporte le coût du cloud computing. Aujourd’hui, il est gratuit et sans limites pour l’utilisateur, mais on ne peut exclure que cela puisse changer à l’avenir.

Pour résoudre ce problème, différentes voies s’offrent à l’industrie, en plus de réaliser des processeurs plus puissants. Premièrement, trouvez des modèles plus nombreux et de meilleure qualité qui peuvent fonctionner efficacement et rapidement sur l’appareil. Deuxièmement, facturez une sorte d’abonnement pour utiliser certains services. Troisièmement, limiter l’utilisation des fonctionnalités, tout comme le fait ChatGPT, qui après plusieurs requêtes (même après avoir payé l’abonnement), bloque l’accès à ses modèles les plus avancés.

-