Анализ и оценка систем адресации данных в современных...

17
Квалификационная работа «Анализ и оценка систем адресации данных в современных ЭВМ» Выполнил: студент 1 курса группа НКС Герасимов С.В.

Upload: sergey-gerasimov

Post on 18-Jul-2015

121 views

Category:

Technology


2 download

TRANSCRIPT

Page 1: Анализ и оценка систем адресации данных в современных ЭВМ

Квалификационная работа

«Анализ и оценка систем адресации данных в современных ЭВМ»

Выполнил:студент 1 курса

группа НКСГерасимов С.В.

Page 2: Анализ и оценка систем адресации данных в современных ЭВМ

Концепция хранения

Взаимодополняющие технологии развития:

1. СОД (обработка данных)

2. СППР (принятие решений)

Сложившаяся ситуация: информации слишком много, но она не структурирована и как следствие недостоверна

Именно на разрешение этого противоречия - отсутствие информации при наличии и даже избытке - и нацелена концепция Хранилищ Данных (Data Warehouse)

Не менее известны и другие концепции: Information Warehouse, Data Mart, On-Line Analitical Processing (OLAP), Relational On-Line Analitical Processing (ROLAP)

Page 3: Анализ и оценка систем адресации данных в современных ЭВМ

Файловая система

Часть операционной системы, которая «отвечает» за корректное хранение данных и предоставление доступа к ним пользователю и прикладным программам

Порядок, определяющий способ организации, хранения и именования данных на носителях информации ИТ-оборудования

Система адресации данных является одной из самых существенных составных частей файловой системы. Именно система адресации позволяет находить нужный файл среди множества как пустых, так и занятых блоков на диске.

Page 4: Анализ и оценка систем адресации данных в современных ЭВМ

Задачи

1. именование файлов;

2. программный интерфейс работы с файлами для приложений;

3. отображения логической модели файловой системы на физическую организацию хранилища данных;

4. организация устойчивости файловой системы к сбоям питания, ошибкам аппаратных и программных средств;

5. содержание параметров файла, необходимых для правильного его взаимодействия с другими объектами системы (ядро, приложения и пр.).

Page 5: Анализ и оценка систем адресации данных в современных ЭВМ

Физическая структура

Сектор (sector) является наименьшей порцией данных, имеющей уникальный адрес на жестком диске

Каждый жесткий диск – это «слоеный пирог» из нескольких дисков, то совокупность дорожек, одинаково удаленных от центра на всех рабочих поверхностях дисков, образует так называемый цилиндр

Page 6: Анализ и оценка систем адресации данных в современных ЭВМ

Выбор ФС

Наиболее важные параметры при выборе файловой системы FAT, FAT32, NTFS 4.0 или NTFS 5.0.:

- нужно понять для чего будет использована ФС, будь то сервер или рабочая станция

- нужно учитывать количество дисков, требования к безопасности

Page 7: Анализ и оценка систем адресации данных в современных ЭВМ

Минимальный размер кластера FAT, NTFS

Кластер (Cluster) – это минимальный участок памяти на диске, который может быть выделен файловой системой при создании файла. Физически кластер представляет собой несколько смежных секторов, число которых должно быть равно степени 2 (то есть кластер может включать 1, 2, 4, 8, 16, 32 или даже 64 сектора)

Page 8: Анализ и оценка систем адресации данных в современных ЭВМ

Логическая конфигурация

Раздел (Partition) – это часть физического диска, которая после форматирования может использоваться файловой системой как отдельное устройство

Типы разделов:

Основной (загрузочный)

Дополнительный (расширенный) Создается с целью преодоления ограничений на количество основных разделов

Активный раздел – основной раздел, с которого производится загрузка ОС при включении компьютера

В начало сектора помещается так называемая главная загрузочная запись – Master Boot Record (MBR)

Page 9: Анализ и оценка систем адресации данных в современных ЭВМ

Физическая организация файла

непрерывное размещение (а);

связанный список кластеров (б);

FAT, связанный список индексов (в);

перечень номеров кластеров (г)

С каждым кластером диска связывается

некоторый элемент – индекс. При такой

физической организации сохраняются все

достоинства предыдущего способа:

минимальность адресной информации,

отсутствие фрагментации, отсутствие проблем

при изменении размера

Page 10: Анализ и оценка систем адресации данных в современных ЭВМ

FAT

Существует несколько разновидностей FAT,

отличающихся разрядностью индексных

указателей, которая и используется в

качестве условного обозначения: FAT12,

FAT16 и FAT32. В файловой системе FAT12

используются 12-разрядные указатели, что

позволяет поддерживать до 4096 кластеров

в области данных диска, в FAT16 - 16-

разрядные указатели для 65 536 кластеров и

в FAT32 - 32-разрядные для более чем 4

миллиардов кластеров.

Page 11: Анализ и оценка систем адресации данных в современных ЭВМ

Недостатки FAT

Используемый в FAT метод хранения адресной информации о файлах не

отличается большой надежностью - при разрыве списка индексных

указателей в одном месте, например из-за сбоя в работе программного

кода ОС по причине внешних электромагнитных помех, теряется

информация обо всех последующих кластерах файла.

Page 12: Анализ и оценка систем адресации данных в современных ЭВМ

Отличительные свойства NTFS

поддержка больших файлов (теоретически до 16 Терабайт) и

больших дисков (2^64 байт);

восстанавливаемость после сбоев и отказов программ и

аппаратуры управления дисками;

высокая скорость операций, в том числе и для больших

дисков;

низкий уровень фрагментации, в том числе и для больших

дисков;

гибкая структура, допускающая развитие за счет добавления

новых типов записей и атрибутов файлов с сохранением

совместимости с предыдущими версиями ФС;

устойчивость к отказам дисковых накопителей;

поддержка длинных символьных имен;

контроль доступа к каталогам и отдельным файлам.

Page 13: Анализ и оценка систем адресации данных в современных ЭВМ

Структура Inode

Page 14: Анализ и оценка систем адресации данных в современных ЭВМ

Создание ФС, база для теста

➔каталог с музыкальными файлами формата mp3, размером

от 10 до 27 Мбайт, суммарным объёмом 430

Мбайт;

➔avi-файл, сшитый из пяти серий фильма "Пункт назначения", объемом 3,4 Гбайт;

➔iso-образ компакт-диска (дистрибутив Xubuntu

12.10 Quantal), объёмом 1,4 Гбайт.

Page 15: Анализ и оценка систем адресации данных в современных ЭВМ

Алгоритм замера

$ cp file newfile

последовательно копировались (в пределах целевого устройства и его файловой системы) каталог с музыкальными файлами, дерево портежей, avi- и iso-файлы. Затем новобразованные копии столь же последовательно удалялись командой

$ rm -Rf newfile

Время каждой операции замерялось по выводу команды date перед её началом и после успешного завершения, по схеме

$ date && cp file newfile && date

Page 16: Анализ и оценка систем адресации данных в современных ЭВМ

Быстродействие LINUX

ext3, journal reiser, defaults XFS, defaults JFS, defaults ext2, defaults00:00

02:24

04:48

07:12

09:36

12:00

14:24

16:48

Page 17: Анализ и оценка систем адресации данных в современных ЭВМ

Анализ ext2,3 JFS, ReiserFS, XFS

В случае, не очень часто имеющих дело с очень большими файлами и файловыми системами, да к тому же владельцев ноутбука, ext2 — первый кандидат.

В качестве второго кандидата можно рассматривать ReiserFS — пожалуй что лидера по интегрированному быстродействию среди журналируемых файловых систем.

ext3 в режиме полного журналирования и JFS. Характерно при этом, что обе эти файловые системы считаются наиболее устойчивыми к сбоям.

JFS — похоже, более подходящим: всё-таки суммарно она оказывается несколько быстрее, нежели ext3 journal

XFS, напротив, будет плохим выбором для файловых систем, содержащих большое количество мелких и часто обновляемых файлов