Как на схеме отмечается розетка


Обозначение розеток на схемах

Одним из наиболее распространенных элементов домашней электросети является электрическая розетка. На схеме она может выглядеть в виде различных обозначений, которые зависят от типа и конструкции этого устройства.

Важнейшим этапом обустройства электрической проводки является составление плана размещения всех ее элементов. Грамотное нанесение на электрическую схему всех составных частей электросети обеспечивает правильность планирования необходимого количества материалов, а также высокий уровень электробезопасности. Правильно составленная схема значительно облегчает выбор типов необходимого оборудования.

План электрической проводки составляется с учетом масштаба помещений и особенностей его планировки.

Совет! Традиционно для составления подобных чертежей используется однолинейная схема, которая позволяет отобразить все элементы сети, не загромождая чертеж большим количеством линий, изображающих соединительные провода.

Руководящие документы

Для того чтобы унифицировать обозначения, используемые в электрических схемах, еще в советское время был принят ГОСТ 21.614-88 «Изображения условные графические электрооборудования и проводок на планах».

В соответствии с этим документом, для обозначения всех элементов электросети используются простейшие геометрические фигуры, позволяющие легко наносить, а также идентифицировать тот или иной элемент на электрической схеме.

Жесткие требования к выполнению подобных чертежей исключают путаницу и двоякое толкование всех нанесенных на схеме символов, что крайне важно при выполнении монтажных работ в электрической сети.

Обозначения элементов открытой установки

Простейшая двухполюсная электрическая розетка открытой установки без заземляющего контакта изображается на электрической схеме в виде полукруга с чертой, проведенной перпендикулярно к его выпуклой части.

Обозначение сдвоенной розетки отличается от предыдущего наличием двух параллельных линий. Графический символ, соответствующий трехполюсному изделию, представляет собой полукруг, к выпуклой части которого примыкают три линии, сходящиеся в одной точке и расположенные веером.

Для обозначения розетки с заземляющим контактом к ее изображению добавляется горизонтальная черта, которая является касательной к верхней точке полукруга.

Розетки для скрытой электропроводки

Скрытая электропроводка является наиболее распространенным типом домашней электрической сети. Для ее прокладки используются устройства, встраиваемые в стену при помощи специальных монтажных коробок.

Единственным отличием обозначения подобных розеток от приведенного выше рисунка является перпендикуляр, опускаемый от середины прямого отрезка к центру окружности.

Устройства с повышенной защитой от пыли и влаги

Рассмотренные розетки не отличаются высоким уровнем защиты от проникновения в их корпус твердых предметов, а также влаги. Такие изделия могут применяться во внутренних помещениях, где условия эксплуатации исключают подобные воздействия. Что касается устройств, предназначенных для установки на открытом воздухе или, например, в ванных комнатах, то согласно принятой классификации степень их защиты должна быть ниже IP44 (где первая цифра соответствует уровню защиты от пыли, вторая – от влаги).

Такие розетки обозначаются на схеме в виде полностью закрашенного черным цветом полукруга. Как и в предыдущем случае, двухполюсные и трехполюсные влагозащищенные розетки обозначаются соответствующим количеством отрезков, примыкающих к выпуклой части полукруга.

Выключатели

Выключатель на схеме обозначается в виде окружности, к которой под углом 45 с наклоном в правую сторону проведена черта, имеющая на конце один, два или три перпендикулярных отрезка (в зависимости от количества клавиш изображаемого выключателя).

Изображение выключателей скрытой установки такое же, только отрезки на конце наклонной черты проводятся в обе стороны от нее на одинаковое расстояние.

Влагостойкие изделия обозначаются окружностью черного цвета.

Стоит обратить внимание на изображение проходных выключателей, которое напоминает два обычных выключателя, зеркально отраженных от центра одной окружности.

Блоки розеток

Нередко в плане домашней электросети необходимо предусмотреть установку блоков, включающих в себя различное количество наиболее распространенных элементов – розеток и выключателей.

Простейший блок, содержащий в своем составе двухполюсную розетку, и одноклавишный выключатель скрытой установки изображается в виде полукруга, от центра которого проведен перпендикуляр, а также линия под углом 45 , соответствующая одноклавишному выключателю.

Аналогичным образом наносятся на схему блоки, содержащие различное количество розеток и выключателей. Например, блок скрытой установки, имеющий в своем составе двухполюсную розетку, а также одноклавишный и двухклавишный выключатели, имеет обозначение:

Таким образом, обозначение элементов на электрической схеме выполняется таким образом, чтобы обеспечить наибольшую легкость в ее составлении и чтении. Стоит один раз запомнить основные принципы построения подобных схем, чтобы в дальнейшем с легкостью пользоваться планом квартирной электропроводки любой сложности.

IT Essentials (версия 7.0) Глава 2 Ответы на экзамен

1. Какой форм-фактор внутреннего жесткого диска SATA чаще всего используется в компьютерах в корпусе Tower?

  • 5,25 дюйма (13,3 см)
  • 6,4 см (2,5 дюйма)
  • 3,5 дюйма (8,9 см) *
  • 2,25 дюйма (5,7 см)

Пояснение Внутренние жесткие диски SATA используются в двух форм-факторах: 3,5 дюйма (8,9 см) и 2,5 дюйма (6,4 см), причем большинство из них - 3.5 дюймов.

2. Обратитесь к экспонату. Какой разъем на передней панели обычно имеет девять или десять контактов, расположенных в два ряда?

  • кнопка включения
  • Индикатор активности накопителя
  • USB *
  • светодиод питания

Пояснение USB-разъем на передней панели обычно состоит из девяти или десяти контактов, расположенных в два ряда. Он также может иметь четыре или пять контактов или отдельные группы из четырех или пяти контактов.

3. Технику необходимо купить сменный адаптер для компьютера отдела. Какой тип адаптера требует, чтобы технический специалист рассмотрел DSP?

  • графика
  • склад
  • звук *
  • захват

Пояснение Факторы, которые следует учитывать при покупке звуковой карты, включают тип слота, цифровой сигнальный процессор (DSP), порт и типы подключения, а также отношение сигнал / шум (SNR).

4. Верно или нет? При установке жесткого диска рекомендуется вручную затянуть крепежные винты привода перед использованием отвертки.

Пояснение При установке жесткого диска слегка затяните вручную все винты, чтобы упростить установку всех винтов. При использовании отвертки не затягивайте винты слишком сильно.

5. Какое возможное обновление оборудования можно использовать для увеличения объема памяти современного смартфона?

  • Флэш-накопитель USB
  • microSD *
  • жесткий диск
  • CompactFlash

Пояснение Из-за размеров сотовых телефонов желательно иметь очень маленькое запоминающее устройство, такое как карта microSD.CompactFlash - это более старая форма запоминающего устройства; он слишком велик для сотового телефона, но широко используется в фотоаппаратах и ​​видеомагнитофонах из-за его большой емкости и высокой скорости доступа. Точно так же USB-накопители и жесткие диски слишком велики для сотового телефона.

6. Какие меры предосторожности следует соблюдать при открытии корпуса компьютера?

  • Оберните липкой лентой острые края корпуса. *
  • Снимите крышку (или дверцу) корпуса компьютера перед установкой или снятием деталей.
  • Удалите соединения с передней панелью перед тем, как полностью открыть корпус.
  • Убедитесь, что любая свободная одежда, такая как галстук или рубашка, постоянно соприкасается с корпусом при работе с внутренними компонентами.

Пояснение: Корпуса компьютеров могут представлять опасность для технических специалистов. Перед работой внутри компьютера осмотрите края корпуса и заклейте любой из острых краев скотчем, чтобы не нанести физический вред. Кейс открывается, но при установке или снятии деталей снимается редко.Перед работой за компьютером необходимо закрепить свободную одежду.

7. Что буква «A» в P-A-S-S напоминает человеку, что делать при использовании огнетушителя?

  • Направьте огнетушитель на пламя.
  • Направьте огнетушитель на основание пожара. *
  • Включите огнетушитель.
  • Отрегулируйте давление.

Пояснение: При использовании средства запоминания P-A-S-S с огнетушителем буква «A» в P-A-S-S означает наведение на основание огня, а не на пламя.

8. Как блок питания обычно подключается к корпусу Tower?

  • ремень удерживающий
  • удерживающая планка
  • винты *
  • стойки

Пояснение: Чтобы установить блок питания в корпус ПК в корпусе Tower, откройте корпус, совместите блок питания с отверстиями в корпусе и используйте винты, чтобы прикрепить блок питания к корпусу.

9. Техник заменяет блок питания.Какие два фактора должен учитывать техник при получении запасной части? (Выберите два.)

  • тип корпуса *
  • уровень входного напряжения 12 или 5 В постоянного тока
  • количество внутренних вентиляторов
  • выходное напряжение
  • мощность *

Пояснение: При выборе источника питания технический специалист должен учитывать следующее: Тип материнской платы
Мощность
Количество и тип разъемов
Тип корпуса
Уровень входной мощности компьютера составляет 120 или 240 В переменного тока.Стандартные выходные напряжения составляют 3,3, 5 и 12 В постоянного тока. В блоке питания обычно есть один вентилятор, и это не выбираемый вариант для вентилятора.

10. Техник устанавливает дополнительную память в компьютер. Как технический специалист может гарантировать, что память правильно выровнена?

  • Этикетка на модуле памяти всегда должна быть обращена к ЦП.
  • Паз в модуле памяти должен совпадать с выемкой в ​​слоте памяти. *
  • Стрелки на модуле памяти должны совпадать со стрелками на слоте материнской платы.
  • Слоты памяти имеют цветовую маркировку: один конец красный, а другой синий.

11. Что используется для предотвращения соприкосновения материнской платы с металлическими частями корпуса компьютера?

  • щит ввода / вывода
  • термопаста
  • стойки *
  • Розетки ЗИФ

Пояснение: Неметаллические винты и стойки могут быть изоляторами и защищать от заземления.

12.Какое утверждение описывает назначение платы разъемов ввода-вывода?

  • Делает порты ввода-вывода на материнской плате доступными для подключения в различных компьютерных корпусах. *
  • Он вставляется в материнскую плату и увеличивает количество доступных слотов для адаптерных карт.
  • Он обеспечивает несколько подключений жестких дисков SATA для подключения к материнской плате.
  • Он подключает разъемы адаптера PCIe, используемые для видео, непосредственно к процессору для более быстрой обработки.

Пояснение: Плата ввода-вывода соединяется с задней частью корпуса и имеет отверстия для каждого из портов на материнской плате, через которые можно протолкнуть, что позволяет использовать материнскую плату во многих различных случаях независимо от количества портов на плате. или их расположение.

13. Какие три важных момента следует учитывать при установке ЦП на материнскую плату? (Выберите три.)

  • Приняты меры антистатической защиты. *
  • ЦП правильно выровнен и вставлен в гнездо.*
  • Контакты процессора сначала очищаются изопропиловым спиртом.
  • Радиатор ЦП и вентилятор установлены правильно. *
  • Батарея CMOS EPROM удаляется перед установкой CPU.
  • Максимальное усилие вставки прикладывается к рычагу нагрузки, поэтому ЦП фиксируется на месте.

Пояснение: ЦП чувствителен к статическим разрядам. Его штифты очень хрупкие и работают при высоких температурах, поэтому необходимо соблюдать меры предосторожности.Если ЦП использовался на другом компьютере или если вентилятор заменяется, может потребоваться удалить старую термопасту с помощью изопропилового спирта (не на контактах ЦП). Аккумулятор не нужно снимать с материнской платы во время установки процессора. Это приведет к потере сохраненных настроек BIOS. Чтобы зафиксировать рычаг загрузки ЦП на месте, необходимо минимальное усилие.

14. Какой компонент больше всего влияет на выбор корпуса и источника питания при создании нового ПК?

  • видеокарта
  • звуковая карта
  • Модуль RAM
  • материнская плата *
  • тип жесткого диска

Пояснение: Выбор материнской платы определяет тип корпуса и блок питания.Форм-фактор материнской платы должен соответствовать типу корпуса и блока питания. На материнскую плату устанавливаются модули оперативной памяти, видеокарты и звуковые карты. Они должны быть совместимы с материнской платой. К корпусу прикреплен жесткий диск, но размеры отсеков для дисков стандартизированы.

15. Какие два фактора необходимо учитывать при замене старых модулей оперативной памяти в ПК? (Выберите два.)

  • Новая оперативная память должна быть совместима с BIOS или UEFI.
  • Новая оперативная память должна быть совместима с материнской платой.*
  • Скорость нового ОЗУ должна поддерживаться набором микросхем. *
  • Блок питания должен обеспечивать напряжение, необходимое для нового ОЗУ.
  • Новая RAM должна соответствовать старой RAM с точки зрения емкости и скорости.

Пояснение: При замене или обновлении ОЗУ на материнской плате новый модуль ОЗУ должен быть совместим с текущей материнской платой. Кроме того, скорость новой оперативной памяти должна поддерживаться набором микросхем.

16. Обратитесь к экспонату. В каком разделе материнской платы будет установлен модуль памяти?

  • участок А
  • раздел Б
  • раздел C *
  • раздел D

Пояснение: Модули памяти вставляются в слоты расширения памяти, которые имеют фиксаторы на каждом конце слота.

17. Какой тип слота расширения материнской платы отправляет данные по одному биту по последовательной шине?

Пояснение: Слот расширения PCIe подключается к последовательной шине, которая отправляет данные по одному биту с гораздо большей скоростью, чем более старый слот PCI, который подключается к параллельной шине.

18. Какая шина материнской платы ПК используется для подключения ЦП к ОЗУ и другим компонентам материнской платы?

  • лицевая сторона *
  • PCI
  • PCIe
  • SATA

Пояснение: Передняя шина (FSB) используется для подключения ЦП к ОЗУ, платам расширения и другим компонентам материнской платы. Скорость этой шины имеет значение при выборе заменяемых материнских плат и оперативной памяти.

19.Где обычно используется буферизованная память?

  • игровые ноутбуки
  • компьютеров игровых
  • ПК для бизнеса
  • сервера *
  • таблеток

Explanation: Буферизованная память используется в компьютерах с большим объемом оперативной памяти, таких как серверы и высокопроизводительные рабочие станции. Буферизованной памяти следует избегать на игровых, рабочих и домашних компьютерах, поскольку она снижает скорость памяти.

20.Техника попросили обновить процессор, и ему необходимо провести некоторые исследования. Компьютеру всего пара лет. Какие два типа пакетов процессоров можно использовать внутри компьютера? (Выберите два.)

Пояснение: В настоящее время в процессорах используются две архитектуры: матричный массив выводов (PGA) и массив наземных сетей (LGA). У PGA есть контакты в нижней части процессора. У LGA есть контакты внутри сокета.

21. Студент хочет увеличить память, чтобы ускорить работу компьютера в корпусе Tower.Какой тип модуля памяти следует искать ученику?

Пояснение: Материнские платы компьютеров в корпусе Tower допускают установку модулей памяти с двухрядным расположением каналов (DIMM) в слотах расширения памяти. Материнская плата поддерживает определенный тип DIMM, такой как модуль DDR3 или DDR4.

22. Какой тип дисковода обычно устанавливается в отсек 5,25 дюйма (13,34 см)?

  • жесткий диск
  • оптический привод *
  • флешка
  • SSD

Пояснение: Оптические приводы установлены в 5.25-дюймовые (13,34 см) отсеки для дисков, доступ к которым осуществляется с передней части корпуса. Флэш-накопители обычно подключаются к USB-портам. Твердотельные накопители и жесткие диски обычно устанавливаются в отсек для дисков 3,5 дюйма (8,9 см) или отсек для дисков 5,25 дюйма (13,34 см), к которым нет доступа с передней стороны корпуса. Если диск меньше отсека, можно приобрести лоток.

23. Техника попросили заказать замену внутреннего жесткого диска SATA. Между какими двумя форм-факторами технический специалист должен будет выбрать? (Выберите два.)

  • 2,25 дюйма (5,72 см)
  • 2,5 дюйма (6,35 см) *
  • 3,5 дюйма (8,89 см) *
  • 5,5 дюйма (13,97 см)
  • 6,25 дюйма (15,88 см)

Пояснение: Для компьютеров в корпусе Tower доступны внутренние жесткие диски в форм-факторах 3,5 и 2,5 дюйма (8,89 см и 6,35 см). SSD обычно имеют форм-фактор 2,5 дюйма.

24. Покупая материнскую плату на замену, покупатель решает также приобрести новый механический жесткий диск и спрашивает совета у продавца.Какой интерфейс хранилища должен порекомендовать продавец для материнской платы и нового диска?

Пояснение: Сегодня механические жесткие диски используют SATA. Устаревшие диски PATA использовали IDE и EIDE. RAID 5 - это технология резервирования дисков.

25. Какой тип слота расширения материнской платы имеет четыре типа от x1 до x16, причем каждый тип имеет разную длину слота расширения?

Пояснение: Шина PCIe или PCI Express имеет четыре типа слотов расширения с разной длиной: x1, x4, x8 и x16.

26. Техник устанавливает новую плату видеоадаптера высокого класса в слот расширения на материнской плате. Что может понадобиться для работы этой карты видеоадаптера?

  • Слот расширения PCI
  • Слот расширения PCIe x 8
  • Два 8-контактных разъема питания *
  • 24-контактный разъем питания ATX

Пояснение: При использовании высокопроизводительной платы видеоадаптера может потребоваться несколько разъемов питания.Каждый из этих разъемов может использовать 6-контактный или 8-контактный разъем питания. Карты видеоадаптеров обычно используют слот PCIe X 16. 24-контактный разъем питания ATX используется для питания материнской платы.

27. См. Экспонат. Какой тип слота расширения показан?

Пояснение: Четыре слота расширения, показанные на экспонате слева направо, - это PCIe x1, PCI, PCIe x16 и PCIx1.

28. См. Экспонат.Какое устройство показано?

  • KVM-переключатель
  • медиа-ридер *
  • оптический привод
  • Диск SATA

Пояснение: Устройство чтения мультимедиа может быть внешним USB-устройством или внутренним устройством, используемым для чтения или записи на карты памяти.

29. Как при сборке ПК идентифицируется контакт 1 на кабелях передней панели, чтобы его можно было правильно совместить с контактом 1 на разъеме панели материнской платы?

  • маленькой стрелкой или насечкой *
  • знаком плюс
  • через P1
  • красным кабелем

Пояснение: Каждый кабель, который подключается к разъему на передней панели на материнской плате, помечен маленькой стрелкой, чтобы определить, какой из контактов является контактом 1, чтобы его можно было совместить с контактом 1 на панели.

30. Техник выбирает ПК, который будет использоваться сотрудником, который хочет использовать клавиатуру и мышь на трех устройствах. Что следует учитывать в первую очередь?

.

Обозначьте эту диаграмму правильными терминами.

Типичный ПК

Детали компьютера

Компьютер - это электронная машина, которая принимает, обрабатывает, хранит и выводит информацию. Типичный компьютер состоит из двух частей: аппаратной и программной.

Аппаратное обеспечение - это любая электронная или механическая часть компьютерной системы, которую вы можете увидеть или потрогать.

Программное обеспечение - это набор инструкций, называемых программой, которые говорят компьютеру, что делать.

Есть три основных аппаратных раздела.

1 ЦП - это сердце компьютера, микросхема микропроцессора, которая обрабатывает данные и координирует работу всех других устройств.

2 Основная память содержит инструкции и данные, обрабатываемые ЦП. Он состоит из двух основных разделов: RAM (оперативная память) и ROM (постоянная память).

3 Периферийные устройства - это физические устройства, подключенные к компьютеру. Включает: Устройства ввода, которые позволяют нам вводить данные и команды (например,г. клавиатура и мышь). Устройства вывода, которые позволяют нам извлекать результаты (например, монитор и принтер). Устройства хранения, которые используются для постоянного хранения информации (например, жесткие диски и приводы DVD-RW). Дисковые накопители используются для чтения и записи данных на диски. На задней панели компьютера есть порты, в которые мы можем подключить внешние устройства (например, сканер, модем и т. Д.). Они обеспечивают связь между компьютером и устройствами.

Функции ПК: ввод, обработка, вывод, хранение

Задача 1

Прочтите эти цитаты и скажите, к какому важному компьютеру они относятся.

1 «Сделайте свой цифровой образ жизни быстрее, выбрав Pentium на 4,3 ГГц». обработка

2 'Щелкните правой кнопкой мыши, чтобы отобразить контекстное меню. 'вход

3 'Вы увидите яркие, детализированные изображения на 17-дюймовом дисплее. выход

4 «Это обеспечит высококачественный отпечаток с четким текстом и впечатляющей графикой». выход

5 'Используйте его, если хотите, чтобы бабушка и дедушка смотрели, как спит новорожденный.' вход

6 'Нажмите любую кнопку, чтобы продолжить. " ввод

Задача 2

Сопоставьте термины с их определениями.

1 привод CD / DVD любой разъем, к которому можно подключить периферийное устройство

2 динамика b Устройство, используемое для вывода голоса и воспроизведения музыки

3 модема c механизмом чтения и / или записи на оптические диски

Устройство с 4 портами d, которое преобразует данные для передачи их через Интернет

Задача 3

Обозначьте эту диаграмму правильными терминами.

Задача 4


Дата: 03.03.2016; вид: 2741


.

>


:

1.. .

2..

3..

:

1.:

>>>

>>>

>>>

>>>

>>>

:

«Мешок с костями» ().100, 2 400. >>>

. ,. >>>

. , 1000. >>>

, г. >>>

-. >>>


Lingualeo - - !!

250 000,. 10! . >>>

- EnglishDom !!

, г.200. . >>>

Skyeng !!

5 000. . >>>


. >>>

13 000. >>>

. >>>

. ,,. >>>

,,!

.

5 алгоритмов кластеризации, которые необходимо знать ученым | Джордж Сейф

Кластеризация - это метод машинного обучения, который включает в себя группировку точек данных. Учитывая набор точек данных, мы можем использовать алгоритм кластеризации для классификации каждой точки данных в определенную группу. Теоретически точки данных, которые находятся в одной группе, должны иметь похожие свойства и / или функции, в то время как точки данных в разных группах должны иметь очень разные свойства и / или функции. Кластеризация - это метод обучения без учителя и распространенный метод статистического анализа данных, используемый во многих областях.

В Data Science мы можем использовать кластерный анализ, чтобы получить ценную информацию из наших данных, наблюдая, в какие группы попадают точки данных, когда мы применяем алгоритм кластеризации. Сегодня мы рассмотрим 5 популярных алгоритмов кластеризации, которые необходимо знать специалистам по данным, а также их плюсы и минусы!

Кластеризация K-средних

K-средних, вероятно, самый известный алгоритм кластеризации. Его преподают на многих вводных курсах по науке о данных и машинному обучению. Это легко понять и реализовать в коде! Посмотрите рисунок ниже для иллюстрации.

Кластеризация K-средних
  1. Для начала мы сначала выбираем несколько классов / групп для использования и случайным образом инициализируем их соответствующие центральные точки. Чтобы определить количество используемых классов, полезно быстро взглянуть на данные и попытаться выделить какие-либо отдельные группы. Центральные точки - это векторы той же длины, что и каждый вектор точек данных, и обозначены буквами «X» на рисунке выше.
  2. Каждая точка данных классифицируется путем вычисления расстояния между этой точкой и центром каждой группы, а затем классификации точки в группе, центр которой находится ближе всего к ней.
  3. На основе этих классифицированных точек мы повторно вычисляем центр группы, взяв среднее значение всех векторов в группе.
  4. Повторите эти шаги для заданного количества итераций или до тех пор, пока центры групп не будут сильно меняться между итерациями. Вы также можете выбрать случайную инициализацию групповых центров несколько раз, а затем выбрать прогон, который, похоже, обеспечил наилучшие результаты.

K-Means имеет то преимущество, что он довольно быстр, поскольку все, что мы на самом деле делаем, это вычисляем расстояния между точками и центрами групп; очень мало вычислений! Таким образом, он имеет линейную сложность O ( n ).

С другой стороны, у K-Means есть несколько недостатков. Во-первых, вы должны выбрать количество групп / классов. Это не всегда тривиально, и в идеале с алгоритмом кластеризации мы хотели бы, чтобы он выяснял это за нас, потому что его цель - получить некоторое представление о данных. K-средство также начинается со случайного выбора центров кластеров и, следовательно, может давать разные результаты кластеризации при разных прогонах алгоритма. Таким образом, результаты могут быть неповторимыми и непротиворечивыми.Другие кластерные методы более последовательны.

K-Medians - это еще один алгоритм кластеризации, связанный с K-средними, за исключением того, что вместо пересчета центральных точек группы с использованием среднего мы используем медианный вектор группы. Этот метод менее чувствителен к выбросам (из-за использования медианы), но намного медленнее для больших наборов данных, так как сортировка требуется на каждой итерации при вычислении медианного вектора.

Кластеризация со средним сдвигом

Кластеризация со средним сдвигом - это алгоритм на основе скользящего окна, который пытается найти плотные области точек данных.Это алгоритм на основе центроидов, означающий, что цель состоит в том, чтобы найти центральные точки каждой группы / класса, который работает путем обновления кандидатов на центральные точки, чтобы они были средними точками в скользящем окне. Эти окна кандидатов затем фильтруются на этапе постобработки, чтобы исключить почти дубликаты, образуя окончательный набор центральных точек и их соответствующих групп. Посмотрите рисунок ниже для иллюстрации.

Кластеризация среднего сдвига для одного скользящего окна
  1. Чтобы объяснить средний сдвиг, мы рассмотрим набор точек в двумерном пространстве, как на иллюстрации выше.Мы начинаем с круглого скользящего окна с центром в точке C (выбранной случайным образом) и с радиусом r в качестве ядра. Среднее смещение - это алгоритм подъема в гору, который включает итеративное смещение этого ядра в область с более высокой плотностью на каждом шаге до сходимости.
  2. На каждой итерации скользящее окно смещается в сторону областей с более высокой плотностью за счет смещения центральной точки на среднее значение точек в пределах окна (отсюда и название). Плотность внутри скользящего окна пропорциональна количеству точек внутри него.Естественно, при переходе к среднему значению точек в окне он будет постепенно перемещаться в области с более высокой плотностью точек.
  3. Мы продолжаем сдвигать скользящее окно в соответствии со средним значением, пока не будет направления, в котором сдвиг может вместить больше точек внутри ядра. Посмотрите на рисунок выше; мы продолжаем перемещать круг до тех пор, пока не перестанем увеличивать плотность (то есть количество точек в окне).
  4. Этот процесс шагов 1-3 выполняется с множеством скользящих окон, пока все точки не окажутся внутри окна.Когда несколько скользящих окон перекрываются, окно, содержащее наибольшее количество точек, сохраняется. Затем точки данных группируются в соответствии со скользящим окном, в котором они находятся.

Иллюстрация всего процесса от начала до конца со всеми скользящими окнами показана ниже. Каждая черная точка представляет собой центр тяжести скользящего окна, а каждая серая точка - это точка данных.

Весь процесс кластеризации среднего сдвига

В отличие от кластеризации K-средних, нет необходимости выбирать количество кластеров, поскольку средний сдвиг автоматически обнаруживает это.Это огромное преимущество. Тот факт, что центры кластера сходятся к точкам максимальной плотности, также весьма желателен, поскольку это довольно интуитивно понятно для понимания и хорошо подходит для естественного управления данными. Недостатком является то, что выбор размера / радиуса окна «r» может быть нетривиальным.

Пространственная кластеризация приложений с шумом на основе плотности (DBSCAN)

DBSCAN - это кластерный алгоритм на основе плотности, аналогичный среднему сдвигу, но с несколькими заметными преимуществами.Посмотрите еще одну красивую картинку ниже, и приступим!

DBSCAN Smiley Face Clustering
  1. DBSCAN начинается с произвольной начальной точки данных, которая не была посещена. Окрестность этой точки извлекается с использованием расстояния epsilon ε (все точки, находящиеся в пределах расстояния ε, являются точками окрестности).
  2. Если в этой окрестности имеется достаточное количество точек (согласно minPoints), то запускается процесс кластеризации, и текущая точка данных становится первой точкой в ​​новом кластере.В противном случае точка будет помечена как шум (позже эта зашумленная точка может стать частью кластера). В обоих случаях эта точка помечается как «посещенная».
  3. Для этой первой точки в новом кластере точки в пределах ее окрестности расстояния ε также становятся частью того же кластера. Эта процедура приведения всех точек в окрестности ε к одному кластеру затем повторяется для всех новых точек, которые были только что добавлены в группу кластеров.
  4. Этот процесс шагов 2 и 3 повторяется до тех пор, пока не будут определены все точки в кластере i.e все точки в пределах ε окрестности кластера были посещены и помечены.
  5. Когда мы закончим с текущим кластером, новая непосещенная точка извлекается и обрабатывается, что приводит к обнаружению следующего кластера или шума. Этот процесс повторяется до тех пор, пока все точки не будут отмечены как посещенные. Поскольку в конце этого процесса все точки были посещены, каждая точка будет отмечена либо как принадлежащая кластеру, либо как шумовая.

DBSCAN обладает некоторыми большими преимуществами перед другими алгоритмами кластеризации.Во-первых, он вообще не требует определенного количества кластеров. Он также определяет выбросы как шумы, в отличие от среднего сдвига, который просто отбрасывает их в кластер, даже если точки данных сильно отличаются. Кроме того, он может довольно хорошо находить кластеры произвольного размера и произвольной формы.

Главный недостаток DBSCAN заключается в том, что он не работает так же хорошо, как другие, когда кластеры имеют разную плотность. Это связано с тем, что установка порогового значения расстояния ε и minPoints для идентификации точек соседства будет варьироваться от кластера к кластеру при изменении плотности.Этот недостаток также возникает с данными очень большого размера, поскольку снова становится сложно оценить пороговое значение расстояния ε.

Кластеризация ожидания – максимизации (EM) с использованием моделей смешения гауссов (GMM)

Одним из основных недостатков K-средних является наивное использование среднего значения для центра кластера. Мы можем понять, почему это не лучший способ решения задач, посмотрев на изображение ниже. С левой стороны человеческому глазу совершенно очевидно, что есть два круглых кластера с разным радиусом 'с одним и тем же средним значением.K-средние не справятся с этим, потому что средние значения кластеров очень близки друг к другу. K-среднее также не работает в тех случаях, когда кластеры не являются круговыми, опять же в результате использования среднего в качестве центра кластера.

Два случая отказа для К-средних.

Гауссовские модели смеси (GMM) дают нам больше гибкости, чем К-средние. В случае GMM мы предполагаем, что точки данных распределены по Гауссу; это менее ограничительное предположение, чем утверждение, что они являются круговыми с использованием среднего. Таким образом, у нас есть два параметра для описания формы кластеров: среднее значение и стандартное отклонение! Если взять пример в двух измерениях, это означает, что кластеры могут принимать любую форму эллипса (поскольку у нас есть стандартное отклонение как по осям x, так и по y).Таким образом, каждое гауссовское распределение относится к одному кластеру.

Чтобы найти параметры гауссианы для каждого кластера (например, среднее значение и стандартное отклонение), мы будем использовать алгоритм оптимизации, называемый ожиданием – максимизацией (EM). Взгляните на рисунок ниже, как иллюстрацию подгонки гауссиан к кластерам. Затем мы можем приступить к процессу кластеризации ожидания – максимизации с использованием GMM.

EM-кластеризация с использованием GMM
  1. Мы начинаем с выбора количества кластеров (как это делает K-Means) и случайной инициализации параметров гауссова распределения для каждого кластера.Можно попытаться дать хорошую оценку начальных параметров, также быстро взглянув на данные. Хотя обратите внимание, как видно на графике выше, это не обязательно на 100%, поскольку гауссианы начинают наши как очень плохие, но быстро оптимизируются.
  2. Учитывая эти гауссовские распределения для каждого кластера, вычислите вероятность того, что каждая точка данных принадлежит определенному кластеру. Чем ближе точка к центру Гаусса, тем больше вероятность, что она принадлежит этому кластеру. Это должно иметь интуитивный смысл, поскольку с распределением Гаусса мы предполагаем, что большая часть данных находится ближе к центру кластера.
  3. На основе этих вероятностей мы вычисляем новый набор параметров для гауссовских распределений, чтобы максимизировать вероятности точек данных в кластерах. Мы вычисляем эти новые параметры, используя взвешенную сумму позиций точек данных, где веса - это вероятности принадлежности точки данных к этому конкретному кластеру. Чтобы объяснить это наглядно, мы можем взглянуть на рисунок выше, в частности на желтый кластер в качестве примера. Распределение начинается случайным образом на первой итерации, но мы видим, что большинство желтых точек находятся справа от этого распределения.Когда мы вычисляем сумму, взвешенную по вероятностям, даже несмотря на то, что рядом с центром есть некоторые точки, большинство из них находятся справа. Таким образом, естественно, что среднее значение распределения смещается ближе к этому набору точек. Мы также можем видеть, что большинство точек расположены «сверху-справа-снизу-слева». Поэтому стандартное отклонение изменяется, чтобы создать эллипс, который больше соответствует этим точкам, чтобы максимизировать сумму, взвешенную по вероятностям.
  4. Шаги 2 и 3 повторяются итеративно до сходимости, когда распределения не сильно меняются от итерации к итерации.

Использование GMM дает два ключевых преимущества. Во-первых, GMM намного больше гибких с точки зрения кластерной ковариации , чем K-средних; из-за параметра стандартного отклонения кластеры могут принимать любую форму эллипса, а не ограничиваться кругами. K-средние фактически являются частным случаем GMM, в котором ковариация каждого кластера по всем измерениям приближается к нулю. Во-вторых, поскольку GMM использует вероятности, они могут иметь несколько кластеров на точку данных. Итак, если точка данных находится в середине двух перекрывающихся кластеров, мы можем просто определить ее класс, сказав, что она принадлежит X-процентов к классу 1 и Y-процентам к классу 2.То есть GMM поддерживают смешанное членство .

Агломеративная иерархическая кластеризация

Алгоритмы иерархической кластеризации делятся на 2 категории: нисходящие и восходящие. Восходящие алгоритмы обрабатывают каждую точку данных как единый кластер вначале, а затем последовательно объединяют (или агломерат ) пары кластеров, пока все кластеры не будут объединены в единый кластер, содержащий все точки данных. Таким образом, восходящая иерархическая кластеризация называется иерархической агломеративной кластеризацией или HAC .Эта иерархия кластеров представлена ​​в виде дерева (или дендрограммы). Корень дерева - это уникальный кластер, который собирает все образцы, а листья являются кластерами только с одним образцом. Перед тем, как перейти к шагам алгоритма, посмотрите рисунок ниже.

Агломеративная иерархическая кластеризация
  1. Мы начинаем с обработки каждой точки данных как одного кластера, т.е. если в нашем наборе данных есть X точек данных, то у нас есть X кластеров. Затем мы выбираем метрику расстояния, которая измеряет расстояние между двумя кластерами.В качестве примера мы будем использовать среднее значение связи , которое определяет расстояние между двумя кластерами как среднее расстояние между точками данных в первом кластере и точками данных во втором кластере.
  2. На каждой итерации мы объединяем два кластера в один. Два кластера, которые необходимо объединить, выбираются как кластеры с наименьшей средней связью. То есть, согласно выбранной нами метрике расстояния, эти два кластера имеют наименьшее расстояние между собой и, следовательно, наиболее похожи и должны быть объединены.
  3. Шаг 2 повторяется до тех пор, пока мы не достигнем корня дерева, т.е. у нас будет только один кластер, содержащий все точки данных. Таким образом, мы можем выбрать, сколько кластеров мы хотим в конце, просто выбрав, когда прекратить объединение кластеров, то есть когда мы перестанем строить дерево!

Иерархическая кластеризация не требует от нас указания количества кластеров, и мы даже можем выбрать, какое количество кластеров выглядит лучше всего, поскольку мы строим дерево. Кроме того, алгоритм нечувствителен к выбору метрики расстояния; все они работают одинаково хорошо, тогда как с другими алгоритмами кластеризации выбор метрики расстояния имеет решающее значение.Особенно хороший вариант использования методов иерархической кластеризации - это когда базовые данные имеют иерархическую структуру, и вы хотите восстановить иерархию; другие алгоритмы кластеризации не могут этого сделать. Эти преимущества иерархической кластеризации достигаются за счет более низкой эффективности, поскольку она имеет временную сложность O (n³) , в отличие от линейной сложности K-средних и GMM.

.

Смотрите также