ОБОБЩЕННЫЕ ТИПИЗИРОВАННЫЕ ЗАВИСИМОСТИ ВКЛЮЧЕНИЯ С НЕОПРЕДЕЛЕННЫМИ ЗНАЧЕНИЯМИ В БАЗАХ ДАННЫХ (2023)
В статье рассматривается новый вид зависимостей в базах данных, являющийся обобщением зависимостей включения. Традиционно такие зависимости на практике используются для обеспечения ссылочной целостности. При этом, ограничение устанавливается только между парой отношений, первое из которых называется главным, второе - внешним. На практике ссылочную целостность часто требуется установить для большего числа отношений, где в одном ограничении участвуют несколько главных и несколько подчиненных отношений. Такая структура соответствует ультраграфу. В работе приведено обоснование обобщенных зависимостей включения, учитывающих наличие неопределенных значений во внешних отношениях. На основе исследования свойств типизированных зависимостей получена система аксиом, для которой доказана непротиворечивость (надежность) и полнота.
Идентификаторы и классификаторы
- eLIBRARY ID
- 54489241
Ссылочная целостность в базах данных (referential integrity) является реализацией бизнес-правил в прикладной области, то есть отражает логику функционирования информационной системы с использованием структурной целостности базы данных (БД). В современных системах управления базами данных (СУБД) такие ограничения поддерживается за счет связей (relationship) на схеме БД. В теории ссылочная целостность была формализована в виде зависимостей включения. Проблема развития теории зависимостей включения до сих пор вызывает интерес со стороны исследователей, прежде всего с точки зрения взаимодействия с другими видами зависимостей в БД. Кроме того, на практике появляются новые виды ссылочных ограничений целостности, которые требуют исследования и встраивания их в общую теорию проектирования БД.
Список литературы
-
J. Ullman, Principles of Database Systems. Stanford University: Computer Science Press, 1980.
-
D. Maier, The Theory of Relational Databases. Rockville: Computer Science Press, 1983.
-
M. Casanova, R. Fagin, and C. Papadimitriou, “Inclusion dependencies and their interaction with functional dependencies”, Journal of Computer and System Sciences, vol. 28, no. 1, pp. 29-59, 1984.
-
A. K. Chandra and M. Y. Vardi, “The Implication Problem for Functional and Inclusion Dependencies is Undecidable”, SIAM Journal on Computing, vol. 14, no. 3, pp. 671-677, 1985.
-
R. Fagin and M. Y. Vardi, “Armstrong databases for functional and inclusion dependencies”, Information Processing Letters, vol. 16, no. 1, pp. 13-19, 1983.
-
P. M. Kanellakis, R. Cosmadakis, and M. Y. Vardi, “Unary inclusion dependencies have polynomial time inference problems”, in Proceedings of the fifteenth annual ACM symposium on Theory of computing, 1983, pp. 264-277.
-
S. S. Cosmadakis, P. C. Kanellakis, and M. Y. Vardi, “Polynomial-time implication problems for unary inclusion dependencies”, Association for Computing Machinery, vol. 37, no. 1, pp. 15-46, 1990.
-
M. Levene and V. M. W., “Justification for Inclusion Dependency Normal Form”, IEEE Transactions on Knowledge and Data Engineering, vol. 12, no. 2, pp. 281-291, 2000.
-
C. Beeri, R. Fagin, D. Maier, and Y. M., “On the Desirability of Acyclic Database Schemes”, Association for Computing Machinery, vol. 30, no. 3, pp. 479-513, 1990.
-
R. Missaoui and R. Godin, "The Implication Problem for Inclusion Dependencies: A Graph Approach", ACM SIGMOD Record, vol. 19, no. 1, pp. 36-40, 1990.
-
M. Hannula and S. Link, "On the Interaction of Functional and Inclusion Dependencies with Independence Atoms", in Database Systems for Advanced Applications, 2018, pp. 353-369.
-
J. Biskup and P. Dublish, "Objects in relational database schemes with functional, inclusion and exclusion dependencies", in 3rd Symposium on Mathematical Fundamentals of Database and Knowledge Base Systems, 1991, pp. 276-290.
-
D. S. Johnson and A. Klug, "Testing Containment of Conjunctive Queries under Functional and Inclusion Dependencies", Journal Computer and System Sciences, vol. 28, no. 1, pp. 167-189, 1984.
-
F. De Marchi, S. Lopes, and J.-M. Petit, "Efficient Algorithms for Mining Inclusion Dependencies", in Advances in Database Technology - EDBT 2002, 2002, pp. 464-476.
-
J. Bauckmann, Z. Abedjan, H. M"uller, and F. Naumann, "Discovering conditional inclusion dependencies", in Proceedings of the 21st ACM International Conference on Information and Knowledge Management, 2012, pp. 2094-2098.
-
M. T. G\'omez-L\'opez, R. M. Gasca, and J. M. P\'erez-\'Alvarez, "Compliance validation and diagnosis of business data constraints in business processes", Information Systems, vol. 48, pp. 26-43, 2015.
-
S. Ma, W. Fan, and L. Bravo, "Extending inclusion dependencies with conditions", Theoretical Computer Science, vol. 515, pp. 64-95, 2014.
-
J. Visser, "Coupled Transformation of Schemas, Documents, Queries, and Constraints", Electronic Notes in Theoretical Computer Science, vol. 200, no. 3, pp. 3-23, 2008.
-
J. Garmany, J. Walker, and T. Clark, Logical Database Design Principles. Auerbach Publications, 1980.
-
S. Lopes, J.-M. Petit, and F. Toumani, "Discovering interesting inclusion dependencies: application to logical database tuning", Information Systems, vol. 27, no. 1, pp. 1-19, 2002. EDN: ASMKXL
-
Y. Kaminsky, E. Pena, and F. Naumann, "Discovering Similarity Inclusion Dependencies", Proceedings of the ACM on Management of Data, vol. 1, no. 1, pp. 1-24, 2023.
-
M. Levene and G. Loizou, "Null Inclusion Dependencies in Relational Databases", Information and Computation, vol. 136, no. 2, pp. 67-108, 1997.
-
M. Levene and G. Loizou, "The additivity problem for data dependencies in incomplete relational databases", in Semantics in Databases, 1998, vol. 1358, pp. 136-169.
-
H. K"ohler and S. Link, "Inclusion Dependencies Reloaded", in Proceedings of the 24th ACM International on Conference on Information and Knowledge Management, New York, NY, USA, 2015, pp. 1361-1370.
-
V. S. Zykin and S. V. Zykin, "Analysis of Typed Inclusion Dependences with Null Values", Automatic Control and Computer Sciences, vol. 52, no. 7, pp. 638-646, 2018. EDN: RNPYPI
-
S. V. Zykin, "Domains of functional dependences in databases", Trudy Instituta Matematiki i Mekhaniki UrO RAN, vol. 22, no. 3, pp. 117-129, 2016. EDN: WIOYSD
Выпуск
Другие статьи выпуска
В статье рассматриваются неориентированные кратные графы произвольной натуральной кратности k>1. Кратный граф содержит ребра трех типов: обычные, кратные и мультиребра. Ребра последних двух типов представляют собой объединение k связанных ребер, которые соединяют 2 или (k+1) вершину соответственно. Связанные ребра могут использоваться только согласованно. Если вершина инцидентна кратному ребру, то она может быть инцидентна другим кратным ребрам, а также она может быть общим концом k связанных ребер мультиребра. Если вершина является общим концом мультиребра, то она не может быть общим концом никакого другого мультиребра. Ставится задача об эйлеровом маршруте (цикле или цепи) в кратном графе, которая обобщает классическую задачу для обычного графа. Сформулированы необходимые условия существования эйлерова маршрута в кратном графе, показано, что эти условия не являются достаточными. Кроме того, показано, что для произвольного кратного графа необходимые условия существования эйлерова цикла и эйлеровой цепи не являются взаимоисключающими, поэтому можно построить кратный граф, в котором одновременно существуют два вида эйлеровых маршрутов. Кратному графу сопоставляется обычный граф с квазивершинами, в упрощенном виде представляющий структуру исходного графа. В частности, каждому эйлерову маршруту в кратном графе соответствует эйлеров маршрут в графе с квазивершинами. Формулируется алгоритм построения такого графа. Также рассмотрена вспомогательная задача о покрывающих цепях с заданными концами в обычном графе, получены два алгоритма ее решения. Разработан алгоритм поиска эйлерова маршрута в кратном графе экспоненциальной трудоемкости. Для частного случая кратного графа предложен полиномиальный алгоритм, показано, что в этом частном случае необходимые условия существования эйлерова маршрута являются достаточными.
Рассмотрена задача о размещении центра обслуживания технических систем при известных значениях потоков отказов. Даная задача решалась с помощью минисуммного алгоритма теории графов. Получена зависимость коэффициента готовности системы от среднего времени наработки между отказами и среднего времени восстановления элементов системы. Показано, что оптимальным местом расположения пункта технического обслуживания является медиана графа, расположенная в одной из его вершин.
Рассматривается задача рационального выбора популяцией участка, содержащего энергетические (пищевые) ресурсы. Рассматриваемая задача относится к теории оптимального фуражирования, которая в свою очередь изучает вопросы, касающиеся поведения популяции, когда она покидает участок или выбирает наиболее подходящий. Для определения оптимального для популяции выбора участка предлагается вариационный подход, основанный на идее распределения Больцмана. Для построения распределения Больцмана вводятся функции полезности, которые учитывают факторы, способные повлиять на выбор популяции: имеющаяся информация о качестве участков, энергетическая полезность участков, затраты на перемещение к участку, стоимость информации о качестве участков. Основная цель статьи - исследовать влияние имеющейся информации о количестве ресурсов, содержащихся в участках, на процесс принятия решений, генерируемых популяцией при выборе подходящего участка. Оптимальная рациональность определяется с учетом стоимости информации, средней энергетической ценности всех участков, рациональности, зависящей от качества участка. Получены условия, при которых популяция при недостатке информации выбирает «бедный» участок в смысле энергетической ценности (ресурсов). Последнее дает теоретическое обоснование экспериментальным наблюдениям, согласно которым, популяция может выбрать участок худшего качества. Полученные результаты носят общий характер и могут быть использованы не только в поведенческой экологии, но и при построении любых процессов принятия решений.
Классическая дедуктивная верификация не ориентирована на доказательство некорректности программ. Доказательство некорректности программ с помощью формальных методов является актуальной задачей в настоящее время. Специальные логики, такие как Incorrectness Logic, Adversarial Logic, Local Completeness Logic, Exact Separation Logic и Outcome Logic, были недавно предложены для решения данной задачи. Но у данных логик имеется два недостатка. Во-первых, в данных логиках используются подходы, основанные на нижней аппроксимации, тогда как в классической дедуктивной верификации используется подход, основанный на верхней аппроксимации. С другой стороны, использование классического подхода требует в общем случае задания инвариантов циклов. Во-вторых, использование правил вывода для программных конструкций в их самом общем виде приводит к необходимости доказательства сложных формул в простых ситуациях. Нашим результатом, представленным в данной статье, является новая логика для решения данных проблем в случае циклов над последовательностями данных. Такая циклы мы называем финитными итерациями. Предложенную логику мы называем логикой для суждений о некорректности финитных итераций (IFIL). Мы избегаем задания инвариантов финитных итераций с помощью символической замены в условиях корректности переменных таких циклов применениями рекурсивных функций. Наша логика основана на специальных правилах вывода для финитных итераций. Эти правила позволяют выводить формулы с применениями рекурсивных функций, соответствующих финитным итерациям. Истинность этих формул может означать наличие ошибок в финитных итерациях. Данная логика была реализована в новой версии программной системы C“=lightVer для дедуктивной верификации программ на языке C.
В данной работе представлено исследование задачи автоматической классификации коротких связных текстов (эссе) на английском языке по уровням международной шкалы CEFR. Определение уровня текста на естественном языке является важной составляющей оценки знаний учащихся, в том числе для проверки открытых заданий в системах электронного обучения. Для решения этой задачи были рассмотрены векторные модели текста на основе стилометрических числовых характеристик уровня символов, слов, структуры предложения. Классификация полученных векторов осуществлялась стандартными классификаторами машинного обучения. В статье приведены результаты трёх наиболее успешных: Support Vector Classifier, Stochastic Gradient Descent Classifier, LogisticRegression. Оценкой качества послужили точность, полнота и F“=мера. Для экспериментов были выбраны два открытых корпуса текстов CEFR Levelled English Texts и BEA“=2019. Лучшие результаты классификации по шести уровням и подуровням CEFR от A1 до C2 показал Support Vector Classifier с F“=мерой 67 % для корпуса CEFR Levelled English Texts. Этот подход сравнивался с применением языковой модели BERT (шесть различных вариантов). Лучшая модель bert“=base“=cased обеспечила значение F“=меры 69 %. Анализ ошибок классификации показал, что большая их часть допущена между соседними уровнями, что вполне объяснимо с точки зрения предметной области. Кроме того, качество классификации сильно зависело от корпуса текстов, что продемонстрировало существенное различие F“=меры в ходе применения одинаковых моделей текста для разных корпусов. В целом, полученные результаты показали эффективность автоматического определения уровня текста и возможность его практического применения.
Издательство
- Издательство
- ЯрГУ им. П.Г. Демидова
- Регион
- Россия, Ярославль
- Почтовый адрес
- 150003, Ярославль, Советская, 14,
- Юр. адрес
- 150003, Ярославль, Советская, 14,
- ФИО
- Иванчин Артем Владимирович (Ректор)
- E-mail адрес
- rectorat@uniyar.ac.ru
- Контактный телефон
- +7 (485) 2797702