<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.3 20210610//EN" "JATS-journalpublishing1-3.dtd">
<article article-type="research-article" dtd-version="1.3" xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml:lang="ru"><front><journal-meta><journal-id journal-id-type="publisher-id">tuzsut</journal-id><journal-title-group><journal-title xml:lang="ru">Труды учебных заведений связи</journal-title><trans-title-group xml:lang="en"><trans-title>Proceedings of Telecommunication Universities</trans-title></trans-title-group></journal-title-group><issn pub-type="ppub">1813-324X</issn><issn pub-type="epub">2712-8830</issn><publisher><publisher-name>СПбГУТ</publisher-name></publisher></journal-meta><article-meta><article-id pub-id-type="doi">10.31854/1813-324X-2024-10-4-142-148</article-id><article-id custom-type="edn" pub-id-type="custom">GKUGLY</article-id><article-id custom-type="elpub" pub-id-type="custom">tuzsut-616</article-id><article-categories><subj-group subj-group-type="heading"><subject>Research Article</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="ru"><subject>ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И ТЕЛЕКОММУНИКАЦИИ</subject></subj-group><subj-group subj-group-type="section-heading" xml:lang="en"><subject>INFORMATION TECHNOLOGIES AND TELECOMMUNICATION</subject></subj-group></article-categories><title-group><article-title>Интеллектуальный метод мутации входных корпусов с обратной связью</article-title><trans-title-group xml:lang="en"><trans-title>Intelligent Method for Mutation of Input Cases with Feedback</trans-title></trans-title-group></title-group><contrib-group><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0009-0007-4911-8471</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Самарин</surname><given-names>Н. Н.</given-names></name><name name-style="western" xml:lang="en"><surname>Samarin</surname><given-names>N. N.</given-names></name></name-alternatives><bio xml:lang="ru"><p>кандидат технических наук, начальник научно-исследовательского отделения № 6 «Научно-исследовательского института «Квант»</p></bio><email xlink:type="simple">samarin_nik@mail.ru</email><xref ref-type="aff" rid="aff-1"/></contrib><contrib contrib-type="author" corresp="yes"><contrib-id contrib-id-type="orcid">https://orcid.org/0000-0002-7121-6031</contrib-id><name-alternatives><name name-style="eastern" xml:lang="ru"><surname>Тулинова</surname><given-names>А. В.</given-names></name><name name-style="western" xml:lang="en"><surname>Tulinova</surname><given-names>A. V.</given-names></name></name-alternatives><bio xml:lang="ru"><p>кандидат технических наук, инженер 1 категории научно-исследовательского отделения № 6 «Научно-исследовательского института «Квант»</p></bio><email xlink:type="simple">yarmak.av@ibks.spbstu.ru</email><xref ref-type="aff" rid="aff-1"/></contrib></contrib-group><aff-alternatives id="aff-1"><aff xml:lang="ru">Научно-исследовательский институт «Квант»<country>Россия</country></aff><aff xml:lang="en">Research Institute «Kvant»<country>Russian Federation</country></aff></aff-alternatives><pub-date pub-type="collection"><year>2024</year></pub-date><pub-date pub-type="epub"><day>05</day><month>09</month><year>2024</year></pub-date><volume>10</volume><issue>4</issue><fpage>142</fpage><lpage>148</lpage><permissions><copyright-statement>Copyright &amp;#x00A9; Самарин Н.Н., Тулинова А.В., 2024</copyright-statement><copyright-year>2024</copyright-year><copyright-holder xml:lang="ru">Самарин Н.Н., Тулинова А.В.</copyright-holder><copyright-holder xml:lang="en">Samarin N.N., Tulinova A.V.</copyright-holder><license license-type="creative-commons-attribution" xlink:href="https://creativecommons.org/licenses/by/4.0/" xlink:type="simple"><license-p>This work is licensed under a Creative Commons Attribution 4.0 License.</license-p></license></permissions><self-uri xlink:href="https://tuzs.sut.ru/jour/article/view/616">https://tuzs.sut.ru/jour/article/view/616</self-uri><abstract><p>Фаззинг-тестирование представляется одним из эффективных способов повышения надежности программного обеспечения и входит в обязательный перечень мероприятий, проводимых на этапе квалификационного тестирования согласно национальному стандарту ГОСТ Р 56939-2016. Использование штатных мутаторов сводит реализацию данной задачи практически к полному перебору, что негативно сказывается на времени обнаружения некорректного поведения программы. В этой связи актуальным является вопрос рационализации подбора входных данных, при котором учитывается специфика корпуса данных, а также контекст, описывающий реакцию тестируемого программного обеспечения и позволяющий определить область и метод мутации на следующей итерации тестирования.</p><p>Цель настоящей работы ‒ повышение эффективности фаззинг-тестирования за счет интеллектуализации штатного мутатора с использованием аппарата нейронных сетей, предполагающей учет синтаксических и семантических особенностей входного корпуса и использующей обратную связь от тестируемой программы.</p><sec><title>Методы исследования</title><p>Методы исследования. При выполнении работы использовались методы анализа и синтеза, теории алгоритмов, дискретной и вычислительной математики, машинного обучения. </p></sec><sec><title>Результаты</title><p>Результаты. Рассмотрены преимущества и недостатки штатного модуля модификации входных корпусов – мутатора – фаззера AFL. Приведено обоснование выбора искусственной нейронной сети на базе архитектуры долгой краткосрочной памяти в качестве механизма, реализующего интеллектуальное управление процессом генерации и преобразования входных корпусов. Описан предлагаемый метод мутации, подразумевающий интеграцию в работу штатного мутатора механизма принятия решения об объеме и формате необходимых мутаций для увеличения покрытия кода, а также последующее уточнение входных данных шелл-кодом для проверки работоспособности фрагмента, вызвавшего нештатное поведение программного обеспечения. Представлена схема работы модуля мутации, включающего в себя компонент преобразования входных корпусов для генерации трасс исполнения программы и компонент, направленный на подтверждение концепта и повторный вызов нештатного поведения программного обеспечения с использованием сформированного шелл-кода.</p></sec><sec><title>Научная новизна</title><p>Научная новизна. В отличие от известных предлагаемый метод использует обратную связь, фиксирующую реакцию программного обеспечения, при формировании стратегии мутации данных, что определяет научную новизну полученных результатов. </p></sec><sec><title>Значимость</title><p>Значимость. Предложенное решение позволяет уменьшить время тестирования программы при сохранении уровня покрытия кода. Полученные в работе результаты являются универсальными и, в перспективе, могут быть использованы при фаззинг-тестировании методами белого, черного и серого ящика.</p></sec></abstract><trans-abstract xml:lang="en"><sec><title>Relevance</title><p>Relevance. Fuzzing is one of the effective ways to improve the software reliability and is included in the mandatory list of research carried out at the stage of qualification testing according to national standard GOST R 56939-2016. The use of standard mutators reduces the fuzzing process to brute force, which negatively affects the time of incorrect program behavior detection. In this regard, it is important to rationalize the selection of input data, which takes into account the data corpus specifics, as well as the context describing the software response under test and allowing to determine the mutations at the next iteration of testing. </p><p>Purpose of the research is to increase the efficiency of fuzzing by intellectualizing the standard mutator using neural networks, which takes into account the syntactic and semantic features of the input corpus and uses program feedback.</p></sec><sec><title>Methods</title><p>Methods. The methods of analysis and synthesis, theory of algorithms, discrete and computational mathematics, machine learning were used.</p></sec><sec><title>Result</title><p>Result. The advantages and disadvantages of the standard module for AFL fuzzer’s input corpus mutation are considered. The justification of neural network choice with LSTM-architecture as a mechanism that realizes the intelligent control of input corpora’s’ generation and transformation is given. The proposed mutation method is described, which implies the integration of decision making mechanism on the amount and format of necessary mutations to increase the code coverage into the standard mutator, as well as the subsequent refinement of input data by shell-code to check the operability of the fragment that caused abnormal software’s behavior. The scheme of the mutation module is presented, which includes a component of input corporas conversion for generation of program execution traces and a component aimed at concept confirmation and re-call of abnormal software behavior using the generated shell-code.</p></sec><sec><title>Novelty</title><p>Novelty. Unlike the known ones, the proposed method uses feedback, fixing the software reaction, when forming the data mutation strategy, which determines the scientific novelty of the obtained results.</p></sec><sec><title>Significance</title><p>Significance. The proposed solution allows reducing the program testing time while maintaining the code coverage. The results obtained in the research are universal and, in the future, can be used in white, black and gray box fuzzing methods.</p></sec></trans-abstract><kwd-group xml:lang="ru"><kwd>кибербезопасность</kwd><kwd>фаззинг-тестирование</kwd><kwd>мутация входного корпуса</kwd><kwd>искусственные нейронные сети</kwd><kwd>сеть с долгой краткосрочной памятью</kwd></kwd-group><kwd-group xml:lang="en"><kwd>cybersecurity</kwd><kwd>fuzzing testing</kwd><kwd>input corpus mutation</kwd><kwd>artificial neural networks</kwd><kwd>long short-term memory network</kwd></kwd-group></article-meta></front><back><ref-list><title>References</title><ref id="cit1"><label>1</label><citation-alternatives><mixed-citation xml:lang="ru">Muduli S.K., Roy S. Satisfiability modulo fuzzing: a synergistic combination of SMT solving and fuzzing // Proceedings of the ACM on Programming Languages. 2022. Vol. 6. Iss. OOPSLA2. PP. 1236−1263. DOI:10.1145/3563332. EDN:VUQLTQ</mixed-citation><mixed-citation xml:lang="en">Muduli S.K., Roy S. Satisfiability modulo fuzzing: a synergistic combination of SMT solving and fuzzing. Proceedings of the ACM on Programming Languages. 2022;6(OOPSLA2):1236−1263. DOI:10.1145/3563332. EDN:VUQLTQ</mixed-citation></citation-alternatives></ref><ref id="cit2"><label>2</label><citation-alternatives><mixed-citation xml:lang="ru">Liu Z., Qian P., Yang J., Liu L., Xu X., He Q., et. al. Rethinking Smart Contract Fuzzing: Fuzzing with Invocation Ordering and I mportant Branch Revisiting // IEEE Transactions on Information Forensics and Security. 2023. Vol. 18. PP. 1237−1251. DOI:10.1109/tifs.2023.3237370. EDN:ZWKGJS</mixed-citation><mixed-citation xml:lang="en">Liu Z., Qian P., Yang J., Liu L., Xu X., He Q., et. al. Rethinking Smart Contract Fuzzing: Fuzzing with Invocation Ordering and Important Branch Revisiting. IEEE Transactions on Information Forensics and Security. 2023;18:1237−1251. DOI:10.1109/tifs.2023.3237370. EDN:ZWKGJS</mixed-citation></citation-alternatives></ref><ref id="cit3"><label>3</label><citation-alternatives><mixed-citation xml:lang="ru">Ерышов В.Г. Фаззинг тестирование. Классификация современных средств фаззинга // Сборник избранных статей по материалам научных конференций ГНИИ "Нацразвитие" Международные научные конференции (Санкт-Петербург, Россия, 26–31 августа 2021 года). СПб.: ГНИИ «Нацразвитие», 2021. С. 287−289. DOI:10.37539/AUG298.2021.94.77.007. EDN:QZILPI</mixed-citation><mixed-citation xml:lang="en">Yeryshov V.G. Fuzzing testing. Classification of modern fuzzing tools. Proceedings of International Scientific Conferences of the National Research Institute "National Development», 26−31 august 2021, St. Petersburg, Russia. St. Petersburg: GNII "National Development" Publ.; 2021. p.287−289. DOI:10.37539/AUG298.2021.94.77.007. EDN:QZILPI</mixed-citation></citation-alternatives></ref><ref id="cit4"><label>4</label><citation-alternatives><mixed-citation xml:lang="ru">Situ L.-Y., Zuo Z.-Q., Guan L., Wang L.-Z., Li X.-D., Shi J., et. al. Vulnerable Region-Aware Greybox Fuzzing // Journal of Computer Science and Technology. 2021. Vol. 36. Iss. 5. PP. 1212−1228. DOI:10.1007/s11390-021-1196-0. EDN:PAPPKT</mixed-citation><mixed-citation xml:lang="en">Situ L.-Y., Zuo Z.-Q., Guan L., Wang L.-Z., Li X.-D., Shi J., et. al. Vulnerable Region-Aware Greybox Fuzzing. Journal of Computer Science and Technology. 2021;36(5):1212−1228. DOI:10.1007/s11390-021-1196-0. EDN:PAPPKT</mixed-citation></citation-alternatives></ref><ref id="cit5"><label>5</label><citation-alternatives><mixed-citation xml:lang="ru">Kim S.J., Shon T. Field classification-based novel fuzzing case generation for ICS protocols // The Journal of Supercomputing. 2018. Vol. 74. Iss. 9. PP. 4434−4450. DOI:10.1007/s11227-017-1980-3. EDN:TLEZVS</mixed-citation><mixed-citation xml:lang="en">Kim S. J., Shon T. Field classification-based novel fuzzing case generation for ICS protocols. The Journal of Supercomputing. 2018;74(9):4434−4450. DOI:10.1007/s11227-017-1980-3. EDN:TLEZVS</mixed-citation></citation-alternatives></ref><ref id="cit6"><label>6</label><citation-alternatives><mixed-citation xml:lang="ru">Wei W., Li X., Zhang B., Li L., Damaševičius R., Scherer R. LSTM-SN: complex text classifying with LSTM fusion social network // The Journal of Supercomputing. 2023. Vol. 79. Iss. 9. PP. 9558−9583. DOI:10.1007/s11227-022-05034-w. EDN:TSXGJI</mixed-citation><mixed-citation xml:lang="en">Wei W., Li X., Zhang B., Li L., Damaševičius R., Scherer R. LSTM-SN: complex text classifying with LSTM fusion social network. The Journal of Supercomputing. 2023;79(9):9558−9583. DOI:10.1007/s11227-022-05034-w. EDN:TSXGJI</mixed-citation></citation-alternatives></ref><ref id="cit7"><label>7</label><citation-alternatives><mixed-citation xml:lang="ru">Bayram F., Aupke P., Bestoun S.A., Kassler A., Theocharis A., Forsman J. DA-LSTM: A dynamic drift-adaptive learning framework for interval load forecasting with LSTM networks // Engineering Applications of Artificial Intelligence. 2023. Vol. 123. P. 106480. DOI:10.1016/j.engappai.2023.106480. EDN:WOXZSB</mixed-citation><mixed-citation xml:lang="en">Bayram F., Aupke P., Bestoun S.A., Kassler A., Theocharis A., Forsman J. DA-LSTM: A dynamic drift-adaptive learning framework for interval load forecasting with LSTM networks. Engineering Applications of Artificial Intelligence. 2023; 123:106480. DOI:10.1016/j.engappai.2023.106480. EDN:WOXZSB</mixed-citation></citation-alternatives></ref><ref id="cit8"><label>8</label><citation-alternatives><mixed-citation xml:lang="ru">Pierre A.A., Akim S.A., Semenyo A.K., Babiga B. Peak Electrical Energy Consumption Prediction by ARIMA, LSTM, GRU, ARIMA-LSTM and ARIMA-GRU Approaches // Energies. 2023. Vol. 16. Iss. 12. P. 4739. DOI:10.3390/en16124739. EDN:RKROHA</mixed-citation><mixed-citation xml:lang="en">Pierre A.A., Akim S.A., Semenyo A.K., Babiga B. Peak Electrical Energy Consumption Prediction by ARIMA, LSTM, GRU, ARIMA-LSTM and ARIMA-GRU Approaches. Energies. 2023;16(12):4739. DOI:10.3390/en16124739. EDN:RKROHA</mixed-citation></citation-alternatives></ref><ref id="cit9"><label>9</label><citation-alternatives><mixed-citation xml:lang="ru">Singh P., Kumar Ch., Kumar A. Next-LSTM: a novel LSTM-based image captioning technique // International Journal of System Assurance Engineering and Management. 2023. Vol. 14. Iss. 4. PP. 1492−1503. DOI:10.1007/s13198-023-01956-7. EDN:QUOVUU</mixed-citation><mixed-citation xml:lang="en">Singh P., Kumar Ch., Kumar A. Singh P. Next-LSTM: a novel LSTM-based image captioning technique. International Journal of System Assurance Engineering and Management. 2023;14(4):1492−1503. DOI:10.1007/s13198-023-01956-7. EDN:QUOVUU</mixed-citation></citation-alternatives></ref><ref id="cit10"><label>10</label><citation-alternatives><mixed-citation xml:lang="ru">Wen X., Li W. Wen X. Time Series Prediction Based on LSTM-Attention-LSTM Model // IEEE Access. 2023. Vol. 11. PP. 48322−48331. DOI:10.1109/access.2023.3276628. EDN:ZAABGZ</mixed-citation><mixed-citation xml:lang="en">Wen X., Li W. Wen X. Time Series Prediction Based on LSTM-Attention-LSTM Model. IEEE Access. 2023;11:48322−48331. DOI:10.1109/access.2023.3276628. EDN:ZAABGZ</mixed-citation></citation-alternatives></ref><ref id="cit11"><label>11</label><citation-alternatives><mixed-citation xml:lang="ru">Ding T., Fu J., Shen R. Research on Multidimensional Mutation Strategy Method of Fuzzing Test // Proceedings of the 40th Chinese Control Conference (CCC, Shanghai, China 26–28 July 2021). Shanghai: IEEE, 2021. PP. 8639−8644. DOI:10.23919/CCC52363.2021.9550435. EDN:MJGBJG</mixed-citation><mixed-citation xml:lang="en">Ding T., Fu J., Shen R. Ding T. Research on Multidimensional Mutation Strategy Method of Fuzzing Test Proceedings of the 40th Chinese Control Conference, CCC, 26–28 July 2021, Shanghai, China. Shanghai: IEEE; 2021. p.8639−8644. DOI:10.23919/CCC52363.2021.9550435. EDN:MJGBJG</mixed-citation></citation-alternatives></ref><ref id="cit12"><label>12</label><citation-alternatives><mixed-citation xml:lang="ru">Manès V.J.M., Han H., Han C., Cha S.K., Egele M., Woo M. The Art, Science, and Engineering of Fuzzing: A Survey // IEEE Transactions on Software Engineering. 2021. Vol. 47. Iss. 11. PP. 2312−2331. DOI:10.1109/TSE.2019.2946563. EDN:ZDDKFN</mixed-citation><mixed-citation xml:lang="en">Manès V.J.M., Han H., Han C., Cha S.K., Egele M., Woo M. The Art, Science, and Engineering of Fuzzing: A Survey. IEEE Transactions on Software Engineering. 2021;47(11):2312−2331. DOI:10.1109/TSE.2019.2946563. EDN:ZDDKFN</mixed-citation></citation-alternatives></ref></ref-list><fn-group><fn fn-type="conflict"><p>The authors declare that there are no conflicts of interest present.</p></fn></fn-group></back></article>
