Künstliche Intelligenz in der Materialwissenschaft

Künstliche Intelligenz in der Materialwissenschaft ist ein stark wachsender Teilbereich der künstlichen Intelligenz (KI), bei dem Daten dazu genutzt werden sollen, um neue Materialien zu entdecken oder Forschende bei der Entdeckung dieser zu unterstützen.[1]

Daten in der Materialwissenschaft

In der Materialwissenschaft werden Daten primär durch Experimente und Computersimulationen gewonnen. Dabei entsteht eine große Menge an Daten und Meta-Daten, die verarbeitet und abgespeichert werden müssen, um anschließend für die unterschiedlichen KI-Ansätze benutzt werden zu können.[2] Da die Materialforschung einen starken interdisziplinären Charakter besitzt, werden Daten aus der Physik, Chemie und den Ingenieurwissenschaften verwendet, aus diesem Grund sind die Datenquellen oft heterogen und es bedarf einer intensiven Vorverarbeitung.[3] Aus diesem Grund ist das Teilen von Daten essentiell für die Forschung an KI in der Materialwissenschaft.

Diesem Teilen stehen allerdings mehrere Barrieren im Weg, die die breite Nutzung von KI in der Materialwissenschaft verhindern:[4]

  1. Undurchsichtige Schlagworte, die verhindern, dass ein typischer Materialwissenschaftler ohne Weiteres erkennen kann, wie datengestützte Methoden auf seine Arbeit angewendet werden könnten
  2. Eigenheiten der von einzelnen Forschern bevorzugten Datenverarbeitungsprozesse
  3. Eine Vielzahl von Interessengruppen, die oft widersprüchliche Ziele verfolgen und aus unterschiedlichen Forschungsbereichen stammen
  4. Begrenzte Verfügbarkeit strukturierter Daten und vereinbarter Datenstandards
  5. Ein Mangel an klaren Anreizen die eigenen Daten mit anderen zu teilen

Um diese Barrieren zu umgehen, gibt es in der Materialwissenschaft diverse Datenbanken, die ihre Daten der Öffentlichkeit zugänglich machen. Diese beschränken sich meistens auf einen Teilbereich der Materialwissenschaften und werden meist von der jeweiligen wissenschaftlichen Community instand gehalten. Ein Beispiel dafür ist PoLyInfo, eine Datenbank für Polymer-Daten.[5]

Einsatzmöglichkeiten

Vorhersage von Materialeigenschaften

Der Großteil der genutzten KI in der Materialwissenschaft dient der Vorhersage von Materialeigenschaften. Dabei werden in der Regel die Materialeigenschaften bereits aus Simulationen oder Experimenten bekannter Materialien als Input-Parameter in ein Machine-Learning-Modell gegeben. Dieses versucht dann durch eine Regression den Raum der noch unbekannten Materialien zu erschließen und ermöglicht es gezielt nach Materialien mit bestimmten Eigenschaften zu suchen, um diese anschließend zu synthetisieren. Oft genutzte Ansätze sind hierbei die Bayes’sche Optimierung,[6][7][8] Support Vector Machines (SVM)[9][10] oder Random Forest Regressoren.[11][12]

Vorhersage neuer Materialien

KI kann dazu genutzt werden völlig neue Materialien zu entdecken. Dabei geht es darum neue Materialien mit bestimmten Materialeigenschaften aus dem chemischen Weißraum, also völlig unerforschten Strukturräumen vorherzusagen. Diese Vorhersagen sind meist deutlich komplizierter als die bloße Vorhersage von Eigenschaften bestimmter Materialien und benötigen deswegen größere Datenmengen. Allerdings funktioniert ein Großteil der Vorhersagen neuer Materialien ähnlich wie die Vorhersage von Materialeigenschaften. Deswegen wurde die erste erfolgreiche Vorhersage eines neuen Materials aus dem chemischen Weißraum von einem Random Forest Regressor geschafft.[11]

Neben Regressions-Ansätzen werden auch andere Methoden verwendet, um neue Materialien vorherzusagen, die nicht über die Eigenschaften dieser Materialien funktionieren. So werden zum Beispiel Convolutional Neural Networks (CNNs) dafür eingesetzt, Abbildungen der Struktur von Materialien zu analysieren um weitere mögliche Materialien mit ihren Strukturen vorherzusagen.[13]

Unterstützung von Experimenten

KI wird außerdem noch dazu eingesetzt, Forschende bei Experimenten zu unterstützen und diese zu leiten. Dabei werden Ansätze mit KI mit Adaptivem Materialdesign, High Throughput Experimentation und Design of Experiments kombiniert.

Adaptive Design

Adaptive Design in der Materialwissenschaft versucht die experimentellen Unsicherheiten zu verringern, indem versucht wird vorherzusagen, welches Experiment als Nächstes durchgeführt werden sollte.[14] Dafür wird eine KI eingesetzt, die versucht die erwartete Verbesserung eines Parameters zu einem vorher definierten Ziel zu erhöhen und den Forschenden das Experiment mit der höchsten Verbesserung vorschlägt. Die Ergebnisse des Experiments werden dann wieder als Input der KI verwendet. Dadurch entsteht ein konstanter Feedback-Loop, der Experimente effizienter machen soll.

High Throughput Experimentation

Bei der High Throughput Experimentation werden sehr viele Experimente parallel durchgeführt, um schnell viele Daten zu generieren.[15] Ziel ist es den optimalen Wert für einen bestimmten Parameter der Experimente zu finden. Diese optimalen Werte werden mit Hilfe der Daten und einer KI berechnet.

Design of Experiments

Design of Experiments (Auch Statistische Versuchsplanung genannt, ist in dem Feld allerdings als Design of Experiments geläufig) ist eine Methode zur Bestimmung der Zusammenhänge der Parameter eines Experiments.[16] Dabei werden mithilfe von KI die Parameter und ihre Zusammenhänge analysiert und die besten Parameter für die Experimente vorhergesagt.

Validierung der Vorhersagen

Während sich KI in der Materialwissenschaft immer weiter verbreitet, werden die meisten Modelle, die entwickelt werden, nicht validiert.[17] Dies liegt daran, dass es für die Validierung eines KI-Modells sowohl Fachwissen in der Materialwissenschaft als auch in der KI geben muss, was selten ist.[18] Außerdem ist es schwierig, Ergebnisse zu veröffentlichen, wenn sich die Voraussagen der KI nicht validieren lassen. Aus diesen Grund kann es sich als sinnvoll erweisen, die eigenen Ergebnisse unvalidiert zu veröffentlichen und sie von anderen, mit einer größeren Material-Expertise, validieren zu lassen.[19]

Ein Ansatz, die Vorhersagen zu überprüfen, ohne ein Experiment oder eine aufwändige Simulation durchführen zu müssen, ist die Gruppen-Kreuzvalidierung. Dabei werden die Materialien, die als Eingabe für die Modelle genutzt werden, nach ihren chemischen Strukturräumen getrennt.[20] Dadurch können die Voraussagen des Modells in einem Strukturraum in anderen Strukturräumen getestet und validiert werden. So kann sichergegangen werden, dass ein Modell allgemeine Voraussagen treffen kann.

Einzelnachweise

  1. Seeram Ramakrishna, Tong-Yi Zhang, Wen-Cong Lu, Quan Qian, Jonathan Sze Choong Low: Materials informatics. In: Journal of Intelligent Manufacturing. Band 30, Nr. 6, August 2019, ISSN 0956-5515, S. 2307–2326, doi:10.1007/s10845-018-1392-0 (springer.com [abgerufen am 12. Juni 2022]).
  2. Manwendra K. Tripathi, Randhir Kumar, Rakesh Tripathi: Big-data driven approaches in materials science: A survey. In: Materials Today: Proceedings. Band 26, 2020, S. 1245–1249, doi:10.1016/j.matpr.2020.02.249 (elsevier.com [abgerufen am 12. Juni 2022]).
  3. Robert W. Cahn: The science of dirt. In: Nature Materials. Band 1, Nr. 1, September 2002, ISSN 1476-1122, S. 3–4, doi:10.1038/nmat701 (nature.com [abgerufen am 12. Juni 2022]).
  4. Joanne Hill, Gregory Mulholland, Kristin Persson, Ram Seshadri, Chris Wolverton: Materials science with large-scale data and informatics: Unlocking new opportunities. In: MRS Bulletin. Band 41, Nr. 5, Mai 2016, ISSN 0883-7694, S. 399–409, doi:10.1557/mrs.2016.93 (springer.com [abgerufen am 12. Juni 2022]).
  5. Shingo Otsuka, Isao Kuwajima, Junko Hosoya, Yibin Xu, Masayoshi Yamazaki: PoLyInfo: Polymer Database for Polymeric Materials Design. In: 2011 International Conference on Emerging Intelligent Data and Web Technologies. September 2011, S. 22–29, doi:10.1109/EIDWT.2011.13 (ieee.org [abgerufen am 12. Juni 2022]).
  6. Stephen Wu, Yukiko Kondo, Masa-aki Kakimoto, Bin Yang, Hironao Yamada: Machine-learning-assisted discovery of polymers with high thermal conductivity using a molecular design algorithm. In: npj Computational Materials. Band 5, Nr. 1, Dezember 2019, ISSN 2057-3960, S. 66, doi:10.1038/s41524-019-0203-2 (nature.com [abgerufen am 13. Juni 2022]).
  7. Dezhen Xue, Prasanna V. Balachandran, Ruihao Yuan, Tao Hu, Xiaoning Qian: Accelerated search for BaTiO 3 -based piezoelectrics with vertical morphotropic phase boundary using Bayesian learning. In: Proceedings of the National Academy of Sciences. Band 113, Nr. 47, 22. November 2016, ISSN 0027-8424, S. 13301–13306, doi:10.1073/pnas.1607412113, PMID 27821777, PMC 5127307 (freier Volltext) – (pnas.org [abgerufen am 13. Juni 2022]).
  8. Hud Wahab, Vivek Jain, Alexander Scott Tyrrell, Michael Alan Seas, Lars Kotthoff: Machine-learning-assisted fabrication: Bayesian optimization of laser-induced graphene patterning using in-situ Raman analysis. In: Carbon. Band 167, Oktober 2020, S. 609–619, doi:10.1016/j.carbon.2020.05.087 (elsevier.com [abgerufen am 13. Juni 2022]).
  9. Adutwum, Lawrence A.; Harynuk, James; Mar, Arthur; Oliynyk, Anton O.: Classifying Crystal Structures of Binary Compounds AB through Cluster Resolution Feature Selection and Support Vector Machine Analysis. 2016, doi:10.7939/R3TQ5RV0R (ualberta.ca [abgerufen am 13. Juni 2022]).
  10. Yifei Chen, Yuan Tian, Yumei Zhou, Daqing Fang, Xiangdong Ding: Machine learning assisted multi-objective optimization for materials processing parameters: A case study in Mg alloy. In: Journal of Alloys and Compounds. Band 844, Dezember 2020, S. 156159, doi:10.1016/j.jallcom.2020.156159 (elsevier.com [abgerufen am 13. Juni 2022]).
  11. a b Michael W. Gaultois, Anton O. Oliynyk, Arthur Mar, Taylor D. Sparks, Gregory J. Mulholland: Perspective: Web-based machine learning models for real-time screening of thermoelectric materials properties. In: APL Materials. Band 4, Nr. 5, 1. Mai 2016, ISSN 2166-532X, S. 053213, doi:10.1063/1.4952607 (scitation.org [abgerufen am 13. Juni 2022]).
  12. Fang Ren, Logan Ward, Travis Williams, Kevin J. Laws, Christopher Wolverton: Accelerated discovery of metallic glasses through iteration of machine learning and high-throughput experiments. In: Science Advances. Band 4, Nr. 4, 6. April 2018, ISSN 2375-2548, S. eaaq1566, doi:10.1126/sciadv.aaq1566, PMID 29662953, PMC 5898831 (freier Volltext) – (science.org [abgerufen am 13. Juni 2022]).
  13. Cheol Woo Park, Chris Wolverton: Developing an improved crystal graph convolutional neural network framework for accelerated materials discovery. In: Physical Review Materials. Band 4, Nr. 6, 1. Juni 2020, ISSN 2475-9953, S. 063801, doi:10.1103/PhysRevMaterials.4.063801 (aps.org [abgerufen am 13. Juni 2022]).
  14. Dezhen Xue, Prasanna V. Balachandran, John Hogden, James Theiler, Deqing Xue: Accelerated search for materials with targeted properties by adaptive design. In: Nature Communications. Band 7, Nr. 1, September 2016, ISSN 2041-1723, S. 11241, doi:10.1038/ncomms11241, PMID 27079901, PMC 4835535 (freier Volltext) – (nature.com [abgerufen am 13. Juni 2022]).
  15. Sebastian Bauer, Norbert Stock: Hochdurchsatz-Methoden in der Festkörperchemie. Schneller zum Ziel. In: Chemie in unserer Zeit. Band 41, Nr. 5, Oktober 2007, S. 390–398, doi:10.1002/ciuz.200700404 (wiley.com [abgerufen am 13. Juni 2022]).
  16. Stavros N. Politis, Paolo Colombo, Gaia Colombo, Dimitrios M. Rekkas: Design of experiments (DoE) in pharmaceutical development. In: Drug Development and Industrial Pharmacy. Band 43, Nr. 6, 3. Juni 2017, ISSN 0363-9045, S. 889–901, doi:10.1080/03639045.2017.1291672 (tandfonline.com [abgerufen am 13. Juni 2022]).
  17. Sterling G. Baird, Marianne Liu, Hasan M. Sayeed, Taylor D. Sparks: Data-Driven Materials Discovery and Synthesis using Machine Learning Methods. 28. Februar 2022, arxiv:2202.02380 [abs].
  18. Paul Raccuglia, Katherine C. Elbert, Philip D. F. Adler, Casey Falk, Malia B. Wenny: Machine-learning-assisted materials discovery using failed experiments. In: Nature. Band 533, Nr. 7601, Mai 2016, ISSN 1476-4687, S. 73–76, doi:10.1038/nature17439 (nature.com [abgerufen am 13. Juni 2022]).
  19. Prasanna V. Balachandran: Data-driven design of B20 alloys with targeted magnetic properties guided by machine learning and density functional theory. In: Journal of Materials Research. Band 35, Nr. 8, 1. April 2020, ISSN 2044-5326, S. 890–897, doi:10.1557/jmr.2020.38.
  20. Bryce Meredig, Erin Antono, Carena Church, Maxwell Hutchinson, Julia Ling: Can machine learning identify the next high-temperature superconductor? Examining extrapolation performance for materials discovery. In: Molecular Systems Design & Engineering. Band 3, Nr. 5, 2018, ISSN 2058-9689, S. 819–825, doi:10.1039/C8ME00012C (rsc.org [abgerufen am 13. Juni 2022]).