Искусственное воображение

Искусственное воображение (синтетическое или машинное воображение) — искусственное моделирование человеческого воображения компьютерами общего или специального назначения или искусственными нейронными сетями, прикладная форма которого известна синтетическая среда[источник не указан 1629 дней].

Термин «искусственное воображение» также используется для описания свойств машин или программ. Исследователи надеются имитировать с их помощью некоторых черт, таких как креативность, юмор и сатира[источник не указан 1629 дней].

Исследование искусственного воображения использует инструменты и идеи из многих областей, включая компьютерные науки, риторику, психологию, искусство, философию, неврологию, аффективные вычисления, искусственный интеллект, когнитивные науки, лингвистику, исследование операций, творческое письмо, вероятность и логику[источник не указан 1629 дней].

Исследователи изучают различные аспекты искусственного воображения, такие как искусственное визуальное воображение[1], искусственное слуховое воображение[2], моделирование/фильтрация контента на основе человеческих эмоций и интерактивного поиска. В некоторых статьях на эту тему рассуждают о том, как искусственное воображение может эволюционировать, создавая искусственный мир[3].

Некоторые исследователи, такие как Г. Шлейс и М. Рицки, сосредоточились на использовании нейронных сетей для моделирования искусственного воображения[4].

Еще одним важным проектом руководят Хирохару Като и Тацуя Харада из Токийского университета в Японии. Они разработали компьютер, способный переводить описание объекта в изображение, что может быть самым простым способом определения искусственного воображения. Их идея основана на концепции изображения как серии пикселей, разделенных на короткие последовательности, соответствующие определенной части изображения. Ученые называют эти последовательности «визуальными словами», и они могут быть интерпретированы машиной, использующей статистическое распределение, чтобы прочитать описание и создать изображение объекта, с которым машина не сталкивалась.

Тема искусственного воображения вызвала интерес у ученых за пределами компьютерных наук, таких как известный специалист по коммуникациям Эрнест Борман, который разработал теорию символической конвергенции и работал над проектом по развитию искусственного воображения в компьютерных системах[5]. С 2017 года в Высшей нормальной школе Парижа проводится Междисциплинарный исследовательский семинар по искусственному воображению и искусству «постдиджитал»[6].

Применение искусственного воображения

Типичное применение искусственного воображения — это интерактивный поиск[источник не указан 1629 дней]. Интерактивный поиск развивается с середины 1990-х годов, сопровождаясь развитием всемирной паутины и оптимизацией поисковых систем. На основе первого запроса и обратной связи от пользователя базы данных, по которым ведётся поиск, реорганизуются для улучшения результатов поиска.

Искусственное воображение позволяет нам синтезировать образы и создавать новый образ, сохранённый в базе данных, независимо от его существования в реальном мире. Например, компьютер показывает результаты, основанные на ответе из исходного запроса. Пользователь выбирает несколько релевантных изображений, а затем технология анализирует эти выборки и реорганизует ранги изображений в соответствии с запросом. В этом процессе искусственное воображение используется для синтеза выбранных изображений и улучшения результата поиска с помощью дополнительных релевантных синтезированных изображений. Метод основан на нескольких алгоритмах, включая алгоритм Роккио и эволюционный алгоритм.

Алгоритм Роккио[7], локализующий смысл запроса вблизи релевантных примеров и вдали от нерелевантных, хорошо работает в небольшой системе, где базы данных расположены в определенных рядах. Эволюционный синтез состоит из двух этапов: стандартный и усовершенствованный алгоритмы[8]. Благодаря обратной связи с пользователем, они синтезируют дополнительные изображения, соответствующие его запросу.

Искусственная мораль и память

Искусственное воображение имеет более широкое применение. В общем смысле все действия по формированию идей, образов и концепций могут быть связаны с воображением. Таким образом, искусственное воображение означает нечто большее, чем просто создание графов. Например, моральное воображение является важным исследовательским подразделом искусственного воображения, несмотря на то, что его классификация затруднительна. Мораль является важной частью человеческой логики, в то время как искусственная мораль играет важную роль в искусственном воображении и искусственном интеллекте.[источник не указан 1629 дней]

Основной вопрос, касающийся моральных аспектов искусственного интеллекта, заключается в том, должны ли люди брать на себя ответственность за ошибки и решения машин, и как развивать хорошо управляемые машины. Поскольку никто не может дать ясного описания лучших моральных правил, создание машины, подчиняющейся общепринятым моральным нормам, пока не представляется возможным. Однако недавние исследования, посвященные искусственной морали, обходят определение морали стороной. Вместо этого машин обучают подражать человеческой морали, используя данные о моральных решениях тысяч разных людей, поэтому обученная таким способом модель способна отражать общепринятые правила.[источник не указан 1629 дней]

Память — ещё одна большая область искусственного воображения[источник не указан 1629 дней]. Такие исследователи, как Од Олива, провели обширную работу над искусственной памятью, особенно зрительной[9]. По сравнению со зрительным воображением, зрительная память больше фокусируется на том, как машина понимает, анализирует и хранит изображения человеческим способом. Кроме этого, были исследованы пространственные характеристики зрительной памяти. Поскольку эта область основана на биологических структурах мозга, были также проведены обширные исследования в области нейробиологии, являющейся пересечением биологии и информатики.

Примечания

  1. Bart Thomee, Mark J. Huiskes, Erwin Bakker, Michael S. Lew. Visual information retrieval using synthesized imagery (англ.) // Proceedings of the 6th ACM international conference on Image and video retrieval - CIVR '07. — Amsterdam, The Netherlands: ACM Press, 2007. — P. 127—130. — ISBN 978-1-59593-733-9. — doi:10.1145/1282280.1282303.
  2. Audio Content Transmission (исп.). University Pompeu Fabra (6 января 2007). Дата обращения: 21 мая 2020. Архивировано из оригинала 6 января 2007 года.
  3. Hypertext and “the hyperreal” | Proceedings of the second annual ACM conference on Hypertext (англ.). dl.acm.org. Дата обращения: 21 мая 2020. Архивировано 26 июня 2020 года.
  4. G. Schleis, M. Rizki. Learning from a random player using the reference neuron model // Proceedings of the 2002 Congress on Evolutionary Computation. CEC'02 (Cat. No.02TH8600). — 2002. — Май (т. 1). — С. 747–752 vol.1. — doi:10.1109/CEC.2002.1007019. Архивировано 1 февраля 2020 года.
  5. Twentieth-Century Roots of Rhetorical Studies, by Jim A. Kuypers and Andrew King, 2001. published by Praeger/Greenwood, page 225.
  6. Postdigital (фр.). Дата обращения: 21 мая 2020. Архивировано 7 мая 2020 года.
  7. Gerard Salton, Chris Buckley. Improving retrieval performance by relevance feedback (англ.) // Journal of the American Society for Information Science. — 1990. — Vol. 41, iss. 4. — P. 288—297. — ISSN 1097-4571. — doi:10.1002/(SICI)1097-4571(199006)41:43.0.CO;2-H.
  8. Bart Thomee, Mark J. Huiskes, Erwin Bakker, Michael S. Lew. Using an Artificial Imagination for Texture Retrieval. Архивировано 20 января 2021 года.
  9. Timothy F. Brady, Talia Konkle, George A. Alvarez, Aude Oliva. Visual long-term memory has a massive storage capacity for object details (англ.) // Proceedings of the National Academy of Sciences. — United States National Academy of Sciences, 2008-09-23. — Vol. 105, iss. 38. — P. 14325—14329. — ISSN 0027-8424. — doi:10.1073/pnas.0803390105. Архивировано 12 ноября 2020 года.