Sécurité des bases de données

Sécurité des bases de données De nos jours, les bases de données sont des composants incontournables des serveurs web et des applications en ligne, qui fournissent du contenu dynamique. Des données secrètes ou critiques peuvent être stockées dans les bases de données : il est donc important de les protéger efficacement. Pour lire ou stocker des informations, il faut se connecter au serveur de bases de données, envoyer une requête valide, lire le résultat et refermer la connexion. De nos jours, le langage le plus courant pour ce type de communication est le langage SQL (Structured Query Language). Voir comment un pirate peut s'introduire dans une requête SQL. Comme on peut s'en douter, PHP ne peut pas protéger les bases de données par lui-même. La section suivante présente les notions de base pour protéger les bases de données, lors de la programmation de scripts PHP. Gardez bien cette règle simple en tête : la défense se fait par couches. Plus il y a de tests pour protéger la base, plus faible sera la probabilité de réussite d'un pirate. En ajoutant à cela un bon schéma de base de données, on obtient une application réussie. Schéma de base de données La première étape est de créer une base de données, à moins d'utiliser une base de données déjà créée. Lorsque la base de données est créée, elle est assignée à un propriétaire, qui a exécuté l'instruction de création. Généralement, seul le propriétaire et le super utilisateur peuvent intervenir avec les tables de cette base, et il faut que ce dernier donne des droits à tous les intervenants qui auront à travailler sur cette base. Les applications ne doivent jamais se connecter au serveur de bases de données sous le nom du propriétaire ou de l'administrateur, car ces utilisateurs ont des droits très importants, et pourront exécuter n'importe quelle requête, comme la modification de tables, l'effacement de lignes ou même encore, la destruction de la base. Il est possible de créer différents utilisateurs de bases de données pour chaque aspect de l'application, avec des droits limités aux seules actions planifiées. Il faut alors éviter que le même utilisateur dispose des droits de plusieurs cas d'utilisation. Cela permet que si des intrus obtiennent l'accès à la base avec l'un de ces jeux de droits, ils ne puissent pas affecter toute l'application. Connexions au serveur de base de données Il est recommandé d'établir des connexions au serveur avec le protocole SSL, pour chiffrer les échanges clients/serveur, afin d'améliorer la sécurité. Il est aussi possible d'utiliser un client SSH pour chiffrer la connexion entre les clients et le serveur de bases de données. Si l'une de ces deux protections est mise en place, il sera difficile de surveiller le trafic et de comprendre les informations échangées. Modèle de stockage avec chiffrement Les protocoles SSL/SSH protègent les données qui circulent entre le serveur et le client : SSL/SSH ne protège pas les données une fois dans la base. SSL est un protocole en ligne. Une fois que le pirate a obtenu l'accès direct à la base de données (en contournant le serveur web), les données sensibles, stockées dans la base sont accessibles directement, à moins que les données de la base ne soient protégées par la base. Chiffrer les données est une bonne solution pour réduire cette menace, mais très peu de bases de données offrent ce type de chiffrement. Le moyen le plus simple pour contourner ce problème est de créer un logiciel de chiffrement propre, et de l'utiliser dans les scripts PHP. PHP peut aider dans cette tâche grâce aux nombreuses extensions dont il dispose, comme OpenSSL et Sodium, qui connaissent un large éventail de méthodes de chiffrement. Le script PHP va chiffrer les données qui seront stockées, et les déchiffrer lorsqu'elles seront relues. Voir la suite pour des exemples d'utilisation de ce chiffrement. Hachage Dans le cas de données vraiment sensibles, si la représentation originale n'est pas nécessaire (pour affichage, ou comparaison), utiliser un hachage est une bonne solution. L'exemple classique est le stockage de mots de passe dans les bases de données, après les avoir passés par un hachage cryptographique. Les fonctions password fournissent une bonne façon de hacher les données sensibles et de travailler avec ces empreintes. La fonction password_hash est utilisée pour hacher une chaîne donnée en utilisant l'algorithme le plus fort actuellement disponible et la fonction password_verify vérifie si le mot de passe fourni correspond au hachage stocké en base de données. Hacher un champ mot de passe ]]> Injection SQL L'injection SQL est une technique où un attaquant exploite les failles dans le code d'application responsable de la création de requêtes SQL dynamiques. L'attaquant peut accéder à des sections privilégiées de l'application, récupérer toutes les informations de la base de données, altérer des données existantes, voire exécuter des commandes dangereuses au niveau système sur l'hôte de la base de données. La vulnérabilité se produit lorsque les développeurs concatènent ou interpolent une entrée arbitraire dans leurs déclarations SQL. Séparation des résultats en pages, et créer des superutilisateurs (PostgreSQL) Dans l'exemple suivant, l'entrée de l'utilisateur est directement interpolée dans la requête SQL, permettant à l'attaquant d'obtenir un compte superutilisateur dans la base de données. ]]> Un utilisateur normal clique sur les boutons 'suivant' et 'précédent', qui sont alors placés dans la variable $offset, encodée dans l'URL. Le script s'attend à ce que la variable $offset soit alors un nombre. Cependant, il est possible de modifier l'URL en ajoutant une nouvelle valeur, au format URL, comme ceci : Si cela arrive, le script donnerait un accès super utilisateur à l'attaquant. Il est à noter que la valeur 0; fournit un décalage valide à la requête originale et la termine correctement. C'est une technique répandue que de forcer l'analyseur SQL à ignorer le reste de la requête, en utilisant les symboles -- pour mettre en commentaires. Un moyen disponible pour accéder aux mots de passe est de contourner la recherche de page. Ce que le pirate doit faire, c'est simplement voir si une variable du formulaire est utilisée dans la requête, et si elle est mal gérée. Ces variables peuvent avoir été configurées dans une page précédente pour être utilisées dans les clauses WHERE, ORDER BY, LIMIT et OFFSET des requêtes SELECT. Si la base de données supporte les commandes UNION, le pirate peut essayer d'ajouter une requête entière pour lister les mots de passe dans n'importe quelle table. Utiliser la technique de stocker uniquement des hachages sécurisés des mots de passe au lieu des mots de passe eux-mêmes est fortement recommandé. Liste d'articles ... et quelques mots de passe (n'importe quel serveur de bases de données) ]]> La partie statique de la requête, combinée avec une autre requête SELECT, va révéler les mots de passe : Les instructions UPDATE et INSERT sont également susceptibles à de telles attaques Modifier un mot de passe ... et gain de droits ! (n'importe quel serveur de bases de données) ]]> Un internaute fourbe peut envoyer une valeur telle que ' or uid like'%admin% dans $uid pour modifier le mot de passe utilisateur, ou simplement, utiliser la variable $pwd avec la valeur hehehe', trusted=100, admin='yes pour obtenir des droits supplémentaires. La requête devient alors : ]]> Bien qu'il reste évident qu'un attaquant doit posséder au moins certaines connaissances sur l'architecture de la base de données pour mener une attaque réussie, obtenir ces informations est souvent très simple. Par exemple, le code peut faire partie d'un logiciel open-source et être disponible publiquement. Ces informations peuvent également être divulguées par un code source fermé - même s'il est codé, obscurci ou compilé - et même par le code de l'application à travers l'affichage de messages d'erreur. D'autres méthodes comprennent l'utilisation de noms de table et de colonne typiques. Par exemple, un formulaire de connexion qui utilise une table 'users' avec des noms de colonnes 'id', 'username' et 'password'. Attaque du système d'exploitation de l'hôte de base de données (MSSQL Server) Un exemple effrayant de la manière dont des commandes de niveau système d'exploitation peuvent être accessibles sur certains hôtes de base de données. ]]> Si le pirate injecte la valeur a%' exec master..xp_cmdshell 'net user test testpass /ADD' -- dans la variable $prod, alors la requête $query devient : ]]> MSSQL Server exécute les requêtes SQL en lot, y compris la commande d'ajout d'un nouvel utilisateur à la base de données locale. Si cette application fonctionnait en tant que sa et que le service MSSQLSERVER disposait d'un niveau de droits suffisant, le pirate disposerait désormais d'un compte avec accès au serveur. Certains exemples ci-dessus sont spécifiques à certains serveurs de bases de données, mais cela n'empêche pas des attaques similaires d'être possibles sur d'autres produits. La base de données sera alors vulnérable d'une autre manière. Un exemple amusant concernant l'injection SQL Image de xkcd Techniques de contournement La méthode recommandée pour éviter les injections SQL est de lier toutes les données via des requêtes préparées. L'utilisation de requêtes paramétrées n'est pas suffisante pour éviter complètement les injections SQL, mais c'est le moyen le plus facile et le plus sûr de fournir une entrée aux instructions SQL. Toutes les valeurs littérales dynamiques dans les clauses WHERE, SET et VALUES doivent être remplacées par des espaces réservés. Les données réelles seront liées pendant l'exécution et envoyées séparément de la commande SQL. La liaison de paramètres ne peut être utilisée que pour les données. Les autres parties dynamiques de la requête SQL doivent être filtrées contre une liste connue de valeurs autorisées. Éviter les injections SQL en utilisant des requêtes préparées PDO prepare("SELECT * FROM products WHERE id LIKE ? ORDER BY price {$sortingOrder}"); // La valeur est fournie avec des caractères génériques LIKE $stmt->execute(["%{$productId}%"]); ?> ]]> Les instructions préparées sont fournies par PDO, par MySQLi, et par d'autres bibliothèques de bases de données. Les attaques par injection SQL sont principalement basées sur l'exploitation du code qui n'a pas été écrit en tenant compte de la sécurité. Il ne faut jamais faire confiance à une entrée, en particulier côté client, même si elle provient d'une boîte de sélection, d'un champ de saisie masqué ou d'un cookie. Le premier exemple montre qu'une telle requête simple peut causer des désastres. Une stratégie de défense en profondeur implique plusieurs bonnes pratiques de codage : Il ne faut jamais se connecter à la base de données en tant que superutilisateur ou en tant que propriétaire de la base de données. Il convient de toujours utiliser des utilisateurs personnalisés avec des privilèges minimaux. Il faut vérifier si l'entrée donnée a le type de données attendu. PHP a une large gamme de fonctions de validation d'entrée, des plus simples trouvées dans Fonctions de variables et dans Fonctions de type de caractères (par exemple is_numeric, ctype_digit respectivement) et jusqu'à la prise en charge des Expressions régulières compatibles avec Perl. Si l'application s'attend à une entrée numérique, il convient de vérifier les données avec ctype_digit, de changer silencieusement son type en utilisant settype, ou d'utiliser sa représentation numérique avec sprintf. Si la couche de base de données ne prend pas en charge la liaison de variables, alors il faut mettre chaque valeur fournie par l'utilisateur non numérique entre guillemets avec la fonction d'échappement de chaîne spécifique à la base de données (par exemple mysql_real_escape_string, sqlite_escape_string, etc.). Les fonctions génériques comme addslashes ne sont utiles que dans un environnement très spécifique (par exemple MySQL dans un ensemble de caractères à octets uniques avec NO_BACKSLASH_ESCAPES désactivé), il est donc préférable de les éviter. Il est particulièrement important de ne pas divulguer d'informations spécifiques à la base de données, en particulier sur le schéma, que ce soit de manière légale ou illégale. Se référer également à Rapport d'erreurs et Fonctions de gestion et de journalisation des erreurs. À côté de ces conseils, il est recommandé d'enregistrer les requêtes, soit dans les scripts, soit dans la base elle-même, si elle le supporte. Évidemment, cet enregistrement ne sera pas capable d'empêcher une attaque, mais permettra de retrouver la requête qui a fauté. L'historique n'est pas très utile par lui-même mais au niveau des informations qu'il contient. Plus il y a de détails, mieux c'est.