Gate News rapporte qu’au 17 mars, l’équipe de recherche en intelligence artificielle d’Apple a publié un article lors de l’ICLR 2026, présentant une méthode de génération 3D nommée LiTo (marquage de champ lumineux de surface). Cette méthode permet de générer un objet 3D complet à partir d’une seule image, tout en conservant la cohérence des effets lumineux et des réflexions de Fresnel, tels que les reflets spéculaires, lors du changement de point de vue. Jusqu’à présent, la plupart des méthodes de reconstruction 3D ne pouvaient traiter qu’une seule caractéristique, soit la forme géométrique, soit l’aspect diffus réfléchi, rendant difficile la restitution des détails lumineux et d’ombre qui varient avec l’angle de vue. LiTo encode de manière unifiée la géométrie de l’objet et son apparence dépendante du point de vue dans un même espace latent 3D, puis génère le résultat à l’aide d’un modèle de correspondance de flux latent sous condition d’une seule image. Les données d’entraînement comprennent des milliers d’objets 3D, chacun rendu sous 150 angles de vue et 3 conditions d’éclairage différentes. Le décodeur apprend la reconstruction complète de la géométrie et de l’apparence en extrayant aléatoirement des sous-échantillons. Les expériences montrent que LiTo surpassent les méthodes existantes, telles que TRELLIS, en termes de qualité visuelle et de fidélité à l’image d’entrée. L’article a été rédigé par Jen-Hao Rick Chang, Xiaoming Zhao (co-auteur principal), Dorian Chan et Oncel Tuzel, et est publié sur arXiv.