Depuis son arrivée 2004, Gmail a chamboulé la messagerie électronique. Selon Google, le service aurait attiré 1,5 milliard d’utilisateurs. Si beaucoup de choses ont changé pendant les 15 dernières années, de nombreux aspects de Gmail sont aussi restés inchangés comme l’invasion de spams dans les boîtes.

L’une des priorités de Google et de son service de messagerie est de lutter contre les logiciels malveillants, en particulier ceux qui transitent dans des pièces jointes reçues dans vos boîtes mails. Les macrovirus, qui infectent principalement les documents Microsoft Word, existaient bien avant la création Gmail. Dès 1995, le virus WM.Concept était le premier à toucher les documents du Pack Office, et depuis Microsoft sélectionne par défaut la désactivation des macros dans Office. Pourtant, le problème n’a pas pour autant disparu. Les logiciels malveillants transférés en pièces jointes se sont multipliés, tout comme les solutions de protection. Google estime que les documents malveillants représentent actuellement 58 % de tous les logiciels malveillants qui ciblent les utilisateurs de Gmail. Aujourd’hui, Google riposte avec une IA de deep learning (ou apprentissage profond) afin d’empêcher ce virus d’atteindre votre boîte mail.


Google bloque 99,9 % des pièces jointes malveillantes dans Gmail

C’est sans surprise que nous apprenons la décision de Google d’investir dans la sécurité. En début d’année, le groupe avait payé des hackers 6,5 millions de dollars pour sécuriser internet, et avait également présenté sa mesure préventive visant à suspendre toutes les extensions payées de la boutique en ligne Chrome dès lors qu’une augmentation de la fraude est détectée. Il est donc tout à fait naturel que Google se tourne vers des systèmes de deep learning pour sécuriser Gmail. En 2017, Google annonçait que ce genre de système permettait de bloquer 99,9 % des messages de spam et de phishing. À l’époque, ce chiffre était impressionnant étant donné que plus de 50 % de tous les messages reçus par Gmail étaient alors des spams.

Aujourd’hui, en 2020, le deep learning a été perfectionné, et ce taux de réussite de 99,9 % est toujours valable en ce qui concerne le spam, le phishing et le blocage des logiciels malveillants. Mais c’est la recherche de logiciels malveillants qui a évolué. Le scanner Gmail traite quelque 300 milliards de pièces jointes chaque semaine, à la recherche de documents malveillants à bloquer. Parmi les documents bloqués, Google affirme que 63 % d’entre eux sont différents. C’est cette menace en constante évolution provenant de documents malveillants qui a incité Google à déployer une nouvelle génération de scanners reposant sur le machine learning (apprentissage automatique) : le deep learning.

Comment Google utilise le deep learning pour protéger votre boîte de réception

Le deep learning est déjà utilisé par de nombreuses entreprises, et de nombreuses lectures vous permettront d’en apprendre un peu plus sur son fonctionnement. Au risque de simplifier le concept à l’extrême, on peut considérer le machine learning comme une branche de l’IA qui utilise des algorithmes automodifiables ayant besoin de données structurées intégrées dans le système pour fonctionner correctement. En d’autres termes, le système a besoin d’une intervention humaine. Le deep learning ressemble davantage au cerveau humain, dans la mesure où il utilise une approche de réseau neuronal de traitement des données. Il s’agit d’empiler des couches de ces réseaux de neurones artificiels les unes sur les autres, pour créer un réseau neuronal « profond ». Le deep learning est très utile pour certaines tâches, comme l’identification de photos et leur classement selon des catégories, ou encore la compréhension des commandes vocales. D’ailleurs, Google fait déjà appel à cette technologie pour certains de ses services.

Les taux de détection du deep learning sont en hausse

Selon Google, le nouveau scanner qui fonctionne avec le deep learning est actif depuis fin 2019. Pendant cette période, il a permis d’augmenter de 10 % la « détection quotidienne des documents Office contenant des scripts malveillants ». Étant donnée la quantité de documents scannés chaque jour par Google, ce résultat est impressionnant. Il l’est encore plus au niveau de « la détection des attaques adverses et éclatées », c’est-à-dire le type de distribution massive de documents effectuée par des botnets (un réseau de bots informatiques), qui ont tendance à se faire ponctuellement plutôt qu’à un rythme régulier. Dans ces cas-là, le deep learning a permis d’améliorer de 150 % le taux d’identification des documents malveillants. 

Jake Moore, spécialiste de la cybersécurité chez ESET, affirme : « Les logiciels malveillants évoluent à un rythme que l’industrie de la sécurité a du mal à suivre. Cependant, l’utilisation du deep learning semble pouvoir minimiser le risque que des logiciels malveillants atteignent les boîtes de réception du monde entier ».

 

<<< À lire également : Gmail Fait Peau Neuve Sur iPhone Et iPad >>>