Vous devez vraiment savoir ce qu'est le système de fichiers Andrew

Quand j'ai vu que les créateurs du système de fichiers Andrew (AFS) avaient été nommés récipiendaires du prix du système logiciel ACM de 35 000 $, je me suis dit: "C'est cool, je me souviens d'AFS de l'époque d'entreprises comme Sun Microsystems ... 'me demande pas d'expliquer ce que c'est. "

Ne demandez pas non plus à mes collègues. Une enquête rapide dans une demi-douzaine d'entre eux a révélé la plupart du temps des regards vides à la mention d'Andrew File System, une technologie développée au début des années 1980 et nommée d'après Andrew Carnegie et Andrew Mellon. Mais comme l'indique le prix de l'Association for Computing Machinery, AFS mérite en effet d'être connu comme une technologie fondamentale qui a ouvert la voie à des techniques et applications de cloud computing largement utilisées..

PLUS: Visite tourbillonnante des principaux prix, distinctions et prix de la technologie

Mahadev "Satya" Satyanarayanan, professeur d'informatique à l'Université Carnegie Mellon qui faisait partie de l'équipe AFS, a répondu à quelques-unes de mes questions par e-mail sur les origines de ce système de fichiers distribué évolutif et sécurisé, son importance et sa position actuelle aujourd'hui. Satyanarayanan a été reconnu par ACM avec John Howard, Michael Leon Kazar, Robert Nasmyth Sidebotham, David Nichols, Sherri Nichols, Alfred Spector et Michael West, qui ont travaillé en équipe via le partenariat du Centre des technologies de l'information entre Carnegie Mellon et IBM (ce dernier de qui a accessoirement financé ce prix ACM).

Existe-t-il un moyen de quantifier la généralisation de l'utilisation de l'AFS et les types d'organisations qui l'ont le plus utilisée? Une idée de combien il continue d'être utilisé et pour quelle raison?

Sur une période d'environ 25 ans, AFS a été utilisé par de nombreuses universités américaines et non américaines. De nombreux laboratoires nationaux, centres de calcul intensif et institutions similaires ont également utilisé AFS. Les entreprises du secteur financier (par exemple, Goldman Sachs) et d'autres secteurs ont également utilisé AFS. Un aperçu utile du déploiement d'AFS a été fourni par le document "Une étude empirique d'un système de fichiers distribués à grande échelle" qui a paru dans Transactions ACM sur les systèmes informatiques en 1996. Ce document indique:

"Initialement conçue comme une solution aux besoins informatiques de l'Université Carnegie Mellon, AFS s'est développée pour rassembler environ 1 000 serveurs et 20 000 clients dans 10 pays. Nous estimons que plus de 100 000 utilisateurs utilisent ce système dans le monde entier. nombre d’utilisateurs et de machines, AFS est le plus grand système de fichiers distribué jamais construit et utilisé sérieusement. "

La figure 1 de cet article montre que l'AFS couvrait 59 cellules éducatives, 22 cellules commerciales, 11 cellules gouvernementales et 39 cellules en dehors des États-Unis au moment de l'instantané. En plus de ce grand déploiement fédéré multi-organisations d'AFS, il y avait de nombreux déploiements non fédérés d'AFS au sein d'organisations individuelles.

Quel a été le plus grand impact d'AFS sur les environnements informatiques cloud et d'entreprise d'aujourd'hui?

Tout le monde tient aujourd'hui pour acquis le modèle de stockage des données dans le cloud et de livraison de certaines parties via la mise en cache à la demande en périphérie. Ce modèle a d'abord été conçu et démontré par AFS, et est peut-être son plus grand impact. Il simplifie la complexité de gestion pour le personnel opérationnel, tout en préservant les performances et l'évolutivité pour les utilisateurs finaux. Du point de vue des utilisateurs finaux, la possibilité de marcher jusqu'à n'importe quelle machine et de l'utiliser comme la vôtre offre une flexibilité et une commodité énormes. Toutes les données spécifiques à un utilisateur sont livrées à la demande sur le réseau. Garder synchronisé toutes les machines que vous utilisez devient trivial. Les utilisateurs des organisations qui ont déployé AFS ont trouvé cela une capacité addictive. En effet, c'est cette capacité qui a inspiré les fondateurs de DropBox à créer leur entreprise. Ils avaient utilisé AFS au MIT dans le cadre de l'environnement Athena, et voulaient permettre à plus grande échelle cette capacité sans effort de synchroniser toutes les machines utilisées par une personne. Enfin, de nombreux principes architecturaux et techniques de mise en œuvre d'AFS ont influencé de nombreux autres systèmes au cours des dernières décennies.

Comment est née la création d'AFS en premier lieu?

En 1982, CMU et IBM ont signé un accord de collaboration pour créer un "environnement informatique personnel distribué" sur le campus CMU, qui pourrait plus tard être commercialisé par IBM. La collaboration proprement dite a débuté en janvier 1983. Une bonne référence pour obtenir des informations sur ces premiers jours est le document CACM de 1986 de [James H.] Morris et al intitulé "Andrew: A Distributed Personal Computing Environment". Le contexte de l'accord était le suivant. En 1982, IBM venait de présenter l'IBM PC, qui s'avérait très réussi. Dans le même temps, IBM était pleinement conscient que l'utilisation à l'échelle de l'entreprise de l'informatique personnelle nécessitait la capacité technique de partager des informations facilement, en toute sécurité et avec des contrôles d'accès appropriés. Cela était possible dans les systèmes de temps partagé qui dominaient encore au début des années 80. Comment y parvenir dans le monde dispersé et fragmenté d'une entreprise basée sur PC n'était pas clair en 1982. Une grande partie de l'accord de collaboration IBM-CMU consistait à développer une solution à ce problème. Plus de la moitié de la première année du Centre des technologies de l'information (1983) a été consacrée à un remue-méninges sur la meilleure façon d'atteindre cet objectif. Grâce à ce processus de remue-méninges, un système de fichiers distribué est apparu vers août 1983 comme le meilleur mécanisme de partage d'informations à l'échelle de l'entreprise. Comment mettre en œuvre un tel système de fichiers distribué est alors devenu le centre de nos efforts.

Qu'est-ce que les créateurs d'AFS auraient fait différemment dans la création d'AFS s'ils avaient dû le refaire?

Je peux penser à au moins deux choses: une petite et une grande.

La petite chose est que la conception et l'évolution précoce d'AFS se sont produites avant l'émergence de pare-feu basés sur la [traduction d'adresses réseau (NAT)] dans les réseaux. Celles-ci sont aujourd'hui largement utilisées dans les foyers, les petites entreprises, etc. Leur présence rend difficile pour un serveur de prendre contact avec un client afin d'établir un canal de rappel. Si nous avions développé AFS après l'utilisation généralisée des pare-feu basés sur NAT, nous aurions soigneusement repensé la meilleure façon de mettre en œuvre des rappels en présence de pare-feu NAT.

La chose la plus importante a à voir avec le World Wide Web. Le navigateur Mosaic a vu le jour au début des années 1990 et Netscape Navigator un peu plus tard. À ce moment-là, AFS existait depuis de nombreuses années et était largement utilisé dans de nombreux endroits. Si nous avions réalisé à quel point le navigateur deviendrait précieux en tant qu'outil, nous lui aurions accordé beaucoup plus d'attention. Par exemple, un navigateur peut être utilisé dans AFS en utilisant "file: //" plutôt que "http: //" dans les adresses. Toutes les puissantes machines de mise en cache et de maintenance de cohérence intégrées à AFS auraient alors été accessibles via un outil convivial qui s'est finalement révélé extrêmement précieux. Il est possible que le navigateur et AFS aient eu une évolution beaucoup plus symbiotique, comme HTTP et les navigateurs l'ont finalement fait.

On dirait qu'il y a peut-être des restes d'AFS vivants dans le monde open source?

En effet. OpenAFS continue d'être un projet open source actif. De nombreuses institutions (y compris la CMU) continuent d'utiliser AFS pour une utilisation en production, et ce code est désormais basé sur OpenAFS.

De plus, mon travail sur le système de fichiers Coda est issu de la version de novembre 1986 d'AFS. Coda était open source au milieu des années 1990. Cette base de code continue d'être vivante et fonctionnelle aujourd'hui. Enterrés dans Coda sont des idées et du code réel des premiers AFS.

Certains d'entre vous ont-ils des plans spectaculaires pour ce qu'ils feront avec l'argent du prix?

Rien de concret pour l'instant. Nous avons discuté de la possibilité de faire un don à une cause caritative.

Rejoignez les communautés Network World sur Facebook et LinkedIn pour commenter des sujets qui vous tiennent à cœur.