В работе дан обзор различных подходов к проблеме выявления подозрительных адресов в публичных блокчейнах с помощью методов машинного обучения, в первую очередь, методов классификации. Эта задача весьма актуальны в связи с тем, что все легальные участники рынка криптоактивов сейчас должны соблюдать достаточно строгие правила по уточнению источников средств, участвующих в любой обрабатываемой транзакции. Несмотря на то, что Bitcoin и подобные ему платежные системы считаются анонимными, алгоритмы, использующие последние достижениях в области машинного обучения и искусственного интеллекта вместе с тщательным подбором признаков, описывающих наблюдения, могут демонстрировать весьма хорошие результаты. Рассмотрение ведется в основном для сети Bitcoin, но отмечено несколько интересных примеров для Ethereum. Насколько можно судить, обзор такого рода публикуется на русском языке впервые.
Идентификаторы и классификаторы
Технологии распределенных реестров (distributed ledgers, DLT) активно развиваются и внедряются в финансовой индустрии последнее десятилетие. Созданные небольшой группой энтузиастов в попытке выстроить справедливую децентрализованную платежную инфраструктуру, свободную от излишней бюрократии и системной дискриминации, они относительно быстро завоевали популярность и достигли внушительной рыночной капитализации, что не позволяет относиться к ним как к нишевым решениям. Наиболее известными примерами являются Bitcoin и Ethereum, хотя современная экосистема криптоактивов насчитывает уже более 8 тыс. проектов (хотя многие из них и не представляют интереса). Блокчейн — это лишь одна из возможных архитектурных концепций DLT, но после триумфа Bitcoin именно ее обычно имеют в виду, говоря о распределенных реестрах, хотя это и не верно с позиции строгой терминологии. Настоящий текст посвящен одной группе задач, связанных именно с блокчейнами. Описание технических и инженерных аспектов различных моделей блокчейнов выходит далеко за рамки этой статьи и не нужно для понимания ее содержания. Заинтересованный читатель сможет найти больше подробностей, например, в [Narayanan, 2016; Tschorsch, 2016; Natarajan, 2017].
Список литературы
1. Alarab I., Prakoonwit S., Nacer M. I. Competence of graph convolutional networks for anti-money laundering in Bitcoin blockchain // Proceedings of the 2020 5th International conference on machine learning technologies. - 2020. - С. 23-27.
2. Cai H., Zheng V. W., Chang K. C. C. A comprehensive survey of graph embedding: Problems, techniques, and applications // IEEE transactions on knowledge and data engineering. - 2018. - Т. 30. - №. 9. - С. 1616-1637.
3. Chen W. et al. Detecting Ponzi schemes on Ethereum: Towards healthier blockchain technology // Proceedings of the 2018 World Wide Web conference. - 2018. - С. 1409-1418.
4. Foley S., Karlsen J. R., Putniņš T. J. Sex, drugs, and bitcoin: How much illegal activity is financed through cryptocurrencies? // The Review of Financial Studies. - 2019. - Т. 32. - №. 5. - С. 1798-1853.
5. Goyal P., Ferrara E. Graph embedding techniques, applications, and performance: a survey // Knowledge-Based Systems. - 2018. - Т. 151. - С. 78-94.
6. Hamilton W. L., Ying R., Leskovec J. Representation learning on graphs: Methods and applications // arXiv:1709.05584. 2017.
7. Harlev M. A. et al. Breaking Bad: De-anonymising entity types on the Bitcoin blockchain using supervised machine learning // The 51st Hawaii International Conference on System Sciences. HICSS 2018. - 2018. - С. 3497-3506.
8. Harrigan M., Fretter C. The unreasonable effectiveness of address clustering // 2016 Intl IEEE conferences on ubiquitous intelligence & computing, advanced and trusted computing, scalable computing and communications, cloud and big data computing, internet of people, and smart world congress. - 2016. - С. 368-373.
9. Hu Y. et al. Characterizing and detecting money laundering activities on the Bitcoin network // arXiv:1912.12060. - 2019.
10. Jourdan M. et al. Characterizing entities in the Bitcoin blockchain // 2018 IEEE International conference on data mining workshops (ICDMW). - 2018. - С. 55-62.
11. Liang J. et al. Bitcoin exchange addresses identification and its application in online drug trading regulation. // 23rd Pacific Asia Conference on Information Systems: Secure ICT Platform for the 4th Industrial Revolution, PACIS 2019. - 2019.
12. Lin Y. J. et al. An evaluation of Bitcoin address classification based on transaction history summarization // 2019 IEEE International Conference on Blockchain and Cryptocurrency (ICBC). - 2019. - С. 302-310.
13. Lorenz J. et al. Machine learning methods to detect money laundering in the Bitcoin blockchain in the presence of label scarcity // Proceedings of the first ACM international conference on AI in finance. - 2020. - С. 1-8.
14. Meiklejohn S. et al. A fistful of Bitcoins: characterizing payments among men with no names // Proceedings of the 2013 conference on Internet measurement conference. - 2013. - С. 127-140.
15. Monamo P., Marivate V., Twala B. Unsupervised learning for robust Bitcoin fraud detection //2016 Information Security for South Africa (ISSA). - 2016. - С. 129-134.
16. Möser M., Böhme R., Breuker D. An inquiry into money laundering tools in the Bitcoin ecosystem // 2013 APWG eCrime researchers summit. - 2013. - С. 1-14.
17. Nan L., Tao D. Bitcoin mixing detection using deep autoencoder // 2018 IEEE Third international conference on data science in cyberspace (DSC). - 2018. - С. 280-287.
18. Narayanan A. et al. Bitcoin and cryptocurrency technologies: a comprehensive introduction. - Princeton University Press, 2016.
19. Natarajan H., Krause S., Gradstein H. Distributed ledger technology and blockchain. FinTech Note No. 1. - Washington, DC: World Bank, 2017.
20. Oliveira C. et al. GuiltyWalker: Distance to illicit nodes in the Bitcoin network // arXiv:2102.05373. - 2021.
21. Pham T., Lee S. Anomaly detection in the Bitcoin system - a network perspective // arXiv:1611.03942. - 2016.
22. Pinna A. et al. A Petri nets model for blockchain analysis // The Computer Journal. - 2018. - Т. 61. - №. 9. - С. 1374-1388.
23. Pocher N. et al. Detecting anomalous cryptocurrency transactions: an AML/CFT application of machine learning-based forensics // arXiv:2206.04803. - 2022.
24. Poursafaei F., Hamad G. B., Zilic Z. Detecting malicious Ethereum entities via application of machine learning classification // 2020 2nd Conference on Blockchain Research & Applications for Innovative Networks and Services (BRAINS). - 2020. - С. 120-127. EDN: XFTTER
25. Prado-Romero M. A., Doerr C., Gago-Alonso A. Discovering Bitcoin mixing using anomaly detection // Progress in Pattern Recognition, Image Analysis, Computer Vision, and Applications: 22nd Iberoamerican Congress, CIARP 2017, Valparaíso, Chile, Proceedings 22. - Springer International Publishing, 2018. - С. 534-541.
26. Remy C., Rym B., Matthieu L. Tracking Bitcoin users activity using community detection on a network of weak signals // Complex Networks & Their Applications VI: Proceedings of Complex Networks 2017. - Springer International Publishing, 2018. - С. 166-177.
27. Shao W. et al. Identifying Bitcoin users using deep neural network // Algorithms and Architectures for Parallel Processing: 18th International Conference, ICA3PP 2018, Guangzhou, China, Proceedings, Part IV 18. - Springer International Publishing, 2018. - С. 178-192.
28. Sun Yin H. H. et al. Regulating cryptocurrencies: a supervised machine learning approach to de-anonymizing the Bitcoin blockchain // Journal of Management Information Systems. - 2019. - Т. 36. - №. 1. - С. 37-73.
29. Tam D. S. H. et al. Identifying illicit accounts in large scale E-payment networks - A graph representation learning approach // arXiv:1906.05546. - 2019.
30. Toyoda K., Mathiopoulos P. T., Ohtsuki T. A novel methodology for HYIP operators’ Bitcoin addresses identification // IEEE Access. - 2019. - Т. 7. - С. 74835-74848.
31. Toyoda K., Ohtsuki T., Mathiopoulos P. T. Multi-class Bitcoin-enabled service identification based on transaction history summarization // 2018 IEEE international conference on Internet of things, green computing and communications, social computing and smart data. - 2018. - С. 1153-1160.
32. Tschorsch F., Scheuermann B. Bitcoin and beyond: A technical survey on decentralized digital currencies // IEEE Communications Surveys & Tutorials. - 2016. - Т. 18. - №. 3. - С. 2084-2123.
33. Weber M. et al. Anti-money laundering in Bitcoin: Experimenting with graph convolutional networks for financial forensics // arXiv:1908.02591. - 2019.
34. Wu J. et al. Detecting mixing services via mining Bitcoin transaction network with hybrid motifs // IEEE Transactions on Systems, Man, and Cybernetics: Systems. - 2021. - Т. 52. - №. 4. - С. 2237-2249.
35. Yin H. S., Vatrapu R. A first estimation of the proportion of cybercriminal entities in the Bitcoin ecosystem using supervised machine learning // 2017 IEEE international conference on big data (Big Data). - 2017. - С. 3690-3699.
36. Zola F. et al. Cascading machine learning to attack bitcoin anonymity // 2019 IEEE International Conference on Blockchain. - 2019. - С. 10-17. EDN: JOHURN
Выпуск
Другие статьи выпуска
Работа посвящена анализу структуры затрат на информационно-коммуникационные технологии и оценке факторов, влияющих на их формирование в регионах РФ. Важнейшими потребителями и производителями ИКТ продукции являются высокотехнологические компании, которые постепенно меняют свою финансовую политику, что приводит к формированию и перераспределению затрат. В исследовании показано, что большая часть затрат осуществляется за счет собственных средств предприятий и организаций, причем предприятия сокращают объем использования внешних средств, все больше рассчитывая на свои собственные средства. Для оценки факторов, влияющих на формирование затрат на ИКТ в регионах РФ, рассчитан индекс, показывающий соотношение внутренних и внешних затрат. Регионы проранжированы по значению этого индекса, выделено три группы и произведен регрессионный анализ по данным за 2019 год. Установлено, что наиболее тесная взаимосвязь внутренних затрат на ИКТ в регионах России наблюдается со следующими показателями: ВРП, численность персонала, занятого научными исследованиями, и используемые передовые производственные технологии.
В современной экономической литературе отмечается, что понимание устройства и моделирование работы коллективных ментальных конструкций (моделей) способствует развитию методов анализа процессов выбора и принятия решений, а также лучшему пониманию процессов эволюции экономических систем. Предлагаемое исследование, развивая эту тему, обосновывает идею, что каждый экономический индивид обладает универсальным инструментом координации (УИК), главным элементом которого являются коллективные ментальные конструкции. Индивиды оптимизируют настройки УИК в целях максимально полного учета деятельности друг друга в целях увеличения выгоды от своей совместной деятельности. УИК с настройками является для участников совместной деятельности общей информационной средой, а также средством определения оптимального содержания их совместной деятельности. Обсуждаются основные блоки и функции УИК как особого вида агентной имитационной модели. Рассмотрены необходимые условия для использования УИК. Из полученных результатов вытекает наличие у индивидов с УИК как содержательной, так и процедурной рациональности. Из этого выводится существование в экономических системах двух видов равновесия.
Статья подробно рассматривает применение методов компиляции и интерпретации кода в разработке программного обеспечения, акцентируя внимание на использовании абстрактных синтаксических деревьев (AST) для оптимизации и профилирования кода на примерах языков C++ и Python. Разъясняется процесс создания интерпретирующих профилировщиков на базе AST, которые интегрируют анализ производительности в процесс исполнения программы. Описываются этапы разработки интерпретаторов и применение инструментов, таких как Clang и Python, для работы с AST. В статье также представлены конкретные примеры построения и использования AST, демонстрирующие важность этих методов для улучшения общей эффективности программных решений.
В статье рассматриваются основные тренды, тенденции и перспективы развития розничной торговли в России. Представлен всесторонний анализ эволюции отечественного розничного рынка, обусловленной экономическими, демографическими и технологическими изменениями. В статье выделяются ключевые тренды потребительского поведения, такие как разумный подход к тратам, растущее влияние поколения Z, предпочтительный выбор отечественных товаров, ответственное отношение к здоровью и к окружающей среде. Особое внимание уделяется важности цифровой трансформации в розничной торговле и омниканальному подходу. Авторами была представлена особая группа потребителей - «взломщики цен», которые тщательно ищут лучшие на рынке предложения через доступные каналы продаж. Приведены данные о влиянии инфляции, уровня безработицы, прироста реальной заработной платы и темпов кредитования населения на структуру потребительских расходов. Представлены три авторских прогноза развития розничной торговли в России до 2030 года: оптимистичный, реалистичный и пессимистичный. Оптимистичный прогноз предполагает, что рост доходов населения и повышение покупательской способности, а также адаптация розничной торговли к новым условиям приведут к устойчивому росту отрасли. Реалистичный прогноз основан на постепенной адаптации розничной торговли к текущим вызовам, с умеренным ростом и развитием новых форматов торговли. Пессимистичный прогноз рассматривает самый драматический сценарий развития событий, при котором розничная торговля столкнется со стагнацией под влиянием новых ограничений и вызовов.
Статья продолжает работы авторов по изучению влияния искусственного интеллекта на общественное сознание. Целью настоящего исследования является разработка системного инструментария для обеспечения управленческих решений, позволяющего минимизировать риски негативного воздействия ИИ на цивилизационные особенности России. Для ее достижения авторами начато систематизированное экспериментальное исследование смещения, сжатия, манипулятивности ИИ с учетом факторов индивидуализма - коллективизма и макиавеллизма. Сравнивались контрольные группы людей с группами «личностей», сгенерированных ИИ. Результаты получены на основе небольших выборок, характерных для начальной стадии экспериментов. На орте индивидуализм-коллективизм не имеет места смещение оценок, наследованных ИИ, с бесспорным для любых принятых уровней значимости сжатием вариативности. Напротив, при оценке на макиавеллизм (меру манипулятивности) смещение оценок, наследованных ИИ, значимо отличаются от оценок контрольных групп людей. Полученные результаты позволяют сделать вывод о необходимости дальнейших исследований оценок вариативности по параметру макиавеллизма.
Статья продолжает разработки авторов в сфере восприятия искусственного интеллекта (ИИ), поднимая тему употребления антропоморфизмов в отношении ИИ - наделения его человеческими характеристиками, такими как разум, эмоции, намерения. Задача экспериментального выявления связи склонности людей к антропоморфизации ИИ с рядом личностных характеристик решалась с использованием статистических методов. В ходе пилотного исследования статистически значимых различий между группами мужчин и женщин по выбранным характеристикам обнаружено не было. Выявлена тенденция к наличию слабой связи между склонностью к макиавеллизму и коллективизмом, а также обратной связи между индивидуализмом и макиавеллизмом, обратной корреляции между горизонтальным коллективизмом и склонностью к употреблению антропоморфизмов в отношении искусственного интеллекта.
Технологии искусственного интеллекта во многом базируются на больших данных, и, помимо вычислений, которые обеспечивают должную точность и робастность результатов, а также безопасность систем именно вопросы хранения, передачи и обработки больших данных притягивают к себе пристальное внимание исследователей и разработчиков. Причём работу с данными можно рассматривать на математическом уровне, но в данной работе это сделано на уровне архитектуры информационных систем. А именно, рассматривается вопрос о том, какие модули современных информационных систем в финансовой сфере используют технологии искусственного интеллекта и как они соотносятся с хранилищами и процессорами данных. Структурно работа построена так, что за описанием сфер применения искусственного интеллекта следует обзор изобретений по теме, затем анализируются значимые для предметной области стандарты и, наконец, дана общая архитектура информационной системы.
В статье показана фундаментальная роль отраслевых ставок роялти в лицензионных договорах и аналитического метода их расчета. Аналитический метод расчета ставок роялти (RoS - Royalty on Sales price) на основе рентабельности продаж (ROS) и прибыли до вычета процентов и налогов (EBIT - Earnings Before Interest and Taxes) отличается высокой точностью и учитывает специфику отраслей, в которых используется объект интеллектуальной собственности. Этот метод широко применяется как в судебных экспертизах, так и в коммерческих сделках, охватывая расчеты убытков, оценку рыночной стоимости исключительных прав, а также определение размеров компенсации и вознаграждения авторам в различных юрисдикциях. Показано, что ставка роялти является ключевым элементом двухкомпонентного ценообразования в лицензионных сделках, обеспечивая гибкость и эффективность в управлении интеллектуальной собственностью.
В статье на конкретных примерах показано, как математика высокого класса иногда помогает решать проблемы в области экономики и информационных технологий, для решения которых она изначально не предназначалась. Особо подчеркивается роль выдающихся отечественных математиков относительно недалекого прошлого.
Издательство
- Издательство
- ЦЭМИ РАН
- Регион
- Россия, Москва
- Почтовый адрес
- 117418, Москва, Нахимовский пр, 47
- Юр. адрес
- 117418, Москва, Нахимовский пр, 47
- ФИО
- Альберт Рауфович БАХТИЗИН (Директор)
- E-mail адрес
- albert.bakhtizin@gmail.com
- Контактный телефон
- +7 (499) 1290822