Довідка:Категоризація

Матеріал з Енциклопедія світових субкультур
Перейти до: навігація, пошук

Категоризація - структурування схожих сторінок за темами, формування узагальнюючих категорій, що реалізовується з метою навігації і встановлення співвідношень між сторінками.

Основні визначення

Категорія - сторінка простору назв «Категорія», основний вміст якої формується автоматично на підставі внесення на будь-яку іншу сторінку спеціального тега [[Категорія:<Ім'я>]] , де <ім'я> - назва категорії (ім'я сторінки в просторі назв «Категорія»), і являє собою упорядкований список сторінок, включених в включені в категорію.

Сторінка - сторінка з будь-якого простору імен, в тому числі і з простору категорій.

Стаття - сторінка з основного простору імен.

Включення сторінки в категорію - додавання тег-посилання на цю категорію ( [[Категорія: ...]] ) в код включається сторінки.

Будь-(дочірня категорія) - категорія, включена в цю категорію.

надкатегорії (батьківська категорія) - категорія, в яку включена категорія.

Категорія-нащадок категорії - категорія, ланцюжок батьківських категорій якої можна простежити від даної категорії.

Категорія-предок категорії - категорія, ланцюжок дочірніх категорій якої можна простежити до даної категорії.

Опосередковане включення в категорію - включення сторінки в одну з категорій-нащадків даної категорії.

Тема категорії - вираз, що відповідає предметної області категорії. Часто тема відповідає назві категорії.

Критерій категорії - сформульоване явно чи що на увазі умова включення тієї чи іншої сторінки в категорію. Критерій встановлює відношення (семантичну зв'язок) між темою категорії і включаються в неї сторінками у формі висловлювання. При цьому включається елемент є граматичним суб'єктом висловлювання про ставлення, а тема категорії - складовою частиною предикат а висловлювання про ставлення.

Стаття категорії

Категорія крім автоматично формується списку включених в неї сторінок володіє ім'ям (назвою), а також допоміжною інформацією, що розміщується безпосередньо на сторінці.

На сторінці категорії вказуються:

  • Хоча б одна категорія старшого рівня (обов'язкова вимога);
  • Критерій включення елементів в категорію, особливо в тих випадках, коли цей критерій не слід однозначним чином з назви категорії і можливі розбіжності про включення в категорію тієї чи іншої сторінки;
  • Характеристика принципу включення даної категорії в батьківські, особливо у випадках неочевидності такого включення. Вказується на самій сторінці категорії або в коментарях до тегам батьківських категорій;
  • Навігаційні шаблони з посиланнями на аналогічні категорії в братських проектах фонду Вікімедіа;

Посилання на близькі категорії, які не є предками або нащадками даної;

  • Посилання на основну статтю, відповідну тематиці категорії (наприклад, посилання на сторінку «субкультура» в категорії «Категорія:Субкультури») за допомогою шаблону {{catmain}});
  • Шаблони-індекси, що спрощують навігацію по категорії;
  • Попереджувальні та інформаційні шаблони про статус категорії.

Основні принципи категоризації статей

Включення статті в категорію

Всяка стаття або категорія повинна бути включена хоча б в одну категорію. При цьому стаття по можливості повинна бути включена (безпосередньо або опосередковано) в усіх категоріях, під критерій яких вона підпадає, і ні в одну з тих , під критерій яких вона не підпадає. Якщо стаття підходить за змістом для категорії «А» і її підкатегорії «Б», то її, як правило, слід включати тільки в «Б». Винятком може бути той випадок, коли стаття значима і для всієї категорії «А» (як правило, це оглядові статті, наприклад, «Історія математичних позначень»).

Критерії категоризації статей

В категорію включаються статті або підкатегорії, відповідні критерієм категорії. Основні вимоги до критерію всякої категорії для статей - істотність ознаки категоризації, його унікальність, відповідність базовим правилам Енциклопедії світових субкультур. У категорію також часто включають основну оглядову статтю, відповідну темі категорії.

Суттєвість ознаки означає наявність зафіксованого в авторитетних джерелах способу класифікації категорованих об'єктів, відповідного критерію категорії. Унікальність має на увазі неприпустимість створення множинних категорій з ідентичними або дуже близькими критеріями включення. Верифікованість вимагає можливості перевірити виконання критерію категорії для кожної зі статей на підставі авторитетних джерел. Нейтральна точка зору вимагає дотримання нейтральності в формулюванні критерію.

Зазвичай в якості критерію вибираються наступні відносини ( включається стаття - категорія ):

  • Підмножина і безліч, вид і рід ( зайці - це ссавці , фільми - це твори ).
  • Частина і ціле ( орган - частина організму , вулиця - частина міста ).
  • Об'єкт і рубрика, відповідна дисципліни або сфері діяльності, що має справу з даним об'єктом ( фільми належать до сфери кінематографа , світло вивчається оптикою ).
  • Довільна (асоціативна) зв'язок категорізуемого об'єкта з об'єктом, відповідним темі категорії. Різновидом такого зв'язку є категорії-епонімом ( Тригорское , Наталя Гончарова , Євгеній Онєгін пов'язані з Пушкіним ). Питання про допустимість подібного роду зв'язків є дискусійним.
  • Значна зв'язок іншого певного роду. При цьому питання про значимість того чи іншого виду зв'язку залишається дискусійним і не має зараз однозначного рішення.

У міру наповнення категорій необхідно прагнути до менш розмитим, більш точним і більш науковим формулюванням теми і критеріїв категорій, а також забезпечувати їх транзитивність в тій мірі, в якій це не створює істотних труднощів для учасників.

Граф категорій

Cистема категорій в будь-якій своїй області не повинна являти собою належить лише одній класифікації дерево. Одна і та ж категорія або стаття може бути віднесена до категорій з різних класифікацій, і при категоризації статті в рамках однієї класифікаційної системи практично не важливо, класифікована вона чи ні в рамках інших систем. При цьому, однак, слід уникати циклів (кілець), тобто ситуації, при якій категорія виявляється опосередковано включеної сама в себе, а також інших обмежень, що накладаються правилами на критерії категоризації.

Структуру категорій можна зобразити у вигляді орієнтованого графа, в якому вершини відповідають категоризованим сторінкам (в тому числі і категоріям), а ребра (спрямовані від батьківської категорії до включених в неї сторінок) відповідають включенням сторінок в категорію. Ребра (зв'язку) характеризуються критерієм включення: кожному ребру можна поставити у відповідність той чи інший вид семантичного зв'язку, заданий в критерії батьківської категорії. Вершини характеризуються темою (категорії або сторінки).

Іменування категорій

Назва категорії зазвичай відповідає її темі. При виборі назви можна спиратися на правила іменування для статей, однак враховувати, що для категорій кращі короткі назви. Слід прагнути називати категорії, сформовані на підставі аналогічних критеріїв, за єдиними принципами.

Припустимо існування дублікатів категорій з широко поширеними некоректними або альтернативними назвами, які відповідають будь-якої з категорій основний ієрархії. Такі категорії позначаються шаблоном {{Перейменована категорія}}. Такі категорії створюються для захисту від відтворення помилково, а сторінки, випадково в них потрапили, будуть в підсумку вірно категоризуються.}}

Використання ключа сортування

Більшість статей не вимагають використання ключа сортування, до створення ж тих статей, які його потребують, слід підходити з обережністю. Перш ніж вставляти ключ сортування, слід запитати себе:«На яку букву читач Енциклопедії світових субкультур, швидше за все, стане шукати ту чи іншу статтю?» І тільки з'ясувавши це питання, можна приступати до дій.

Транзитивність

Під транзитивність ю категорій розуміється така їх структура, при якій будь-яка стаття, що входить в яку-небудь категорію, підпадає під критерії будь батьківської категорії аж до самої старшої. Іншими словами, категорія «Б» може бути підкатегорією категорії «А» тільки в тому випадку, якщо всі її статті і підкатегорії всіх рівнів не виходять за рамки категорії «А», а сама вона може бути віднесена до всіх батьківським категоріям категорії «А» . По можливості слід домагатися логічності і транзитивності системи категорій, якщо це не заважає читачам і іншим учасникам.

Багато інструменти і боти в Енциклопедії світових субкультур втрачають свою функціональність при порушеннях транзитивності. У зв'язку з цим настійно не рекомендується порушувати транзитивність в групах категорій, що відносяться до будь-якої тематичної або предметної області.

Транзитивність зазвичай порушується в двох випадках:при недотриманні критерій включення в категорію, або при несумісності (нетранзитивність) самих критеріїв. Перший випадок слід розглядати як помилку, що вимагає виправлення. Другий вимагає уточнення самих критеріїв і детального розгляду конкретного випадку.

Найбільш бажаним є побудова такого дерева категорій, яке б забезпечувало дотримання транзитивності на кожному зв'язку. Нижче наведена таблиця, яка відображає типи зв'язків, які зберігають транзитивність. У випадках, коли транзитивність не забезпечується, можливі два рішення:або перестроювання дерева таким чином, щоб транзитивність дотримувалася, або, у випадках, коли навігація між двома категоріями бажана, але транзитивним чином її реалізувати неможливо, можливим рішенням може бути проставлення посилання на близькі за змістом категорії на самих сторінках категорії за допомогою шаблонів {{addoncat}}, функції парсера {{#categorytree :}} або аналогічними способами.

У всіх випадках слід уникати включення категорії, пов'язаної з будь-яким об'єктом за допомогою відносини, нетранзитивність до вищих, у категорії, що характеризують тільки даний об'єкт, але не всі об'єкти, пов'язані з ним. Замість цього слід включати в таку характеризує категорію тільки саму статтю про вихідний об'єкті.

Виноски

Службові сторінки