12 января в 10:06

Python: коллекции, часть 2/4: индексирование, срезы, сортировка tutorial

Часть 1 Часть 2 Часть 3 Часть 4
imageДанная статья является продолжением моей статьи "Python: коллекции, часть 1: классификация, общие подходы и методы, конвертация".

В данной статье мы продолжим изучать общие принципы работы со стандартными коллекциями (модуль collections в ней не рассматривается) Python.

Для кого: для изучающих Python и уже имеющих начальное представление о коллекциях и работе с ними, желающих систематизировать и углубить свои знания, сложить их в целостную картину.

ОГЛАВЛЕНИЕ:


  1. Индексирование
  2. Срезы
  3. Сортировка

1. Индексирование


1.1 Индексированные коллекции


Рассмотрим индексированные коллекции (их еще называют последовательности — sequences) — список (list), кортеж (tuple), строку (string).

Под индексированностью имеется ввиду, что элементы коллекции располагаются в определённом порядке, каждый элемент имеет свой индекс от 0 (то есть первый по счёту элемент имеет индекс не 1, а 0) до индекса на единицу меньшего длины коллекции (т.е. len(mycollection)-1).

1.2 Получение значения по индексу


Для всех индексированных коллекций можно получить значение элемента по его индексу в квадратных скобках. Причем, можно задавать отрицательный индекс, это значит, что будем находить элемент с конца считая обратном порядке.

При задании отрицательного индекса, последний элемент имеет индекс -1, предпоследний -2 и так далее до первого элемента индекс которого равен значению длины коллекции с отрицательным знаком, то есть (-len(mycollection).
элементы a b c d e
индексы 0 (-5) 1 (-4) 2 (-3) 3 (-2) 4 (-1)
	my_str = "abcde"
	print(my_str[0]) 		# a - первый элемент
	print(my_str[-1])		# e - последний элемент 
	print(my_str[len(my_str)-1]) 	# e - так тоже можно взять последний элемент
	print(my_str[-2]) 		# d - предпоследний элемент

Наши коллекции могут иметь несколько уровней вложенности, как список списков в примере ниже. Для перехода на уровень глубже ставится вторая пара квадратных скобок и так далее.

my_2lvl_list = [[1, 2, 3], ['a', 'b', 'c']]
print(my_2lvl_list[0])      # [1, 2, 3] - первый элемент — первый вложенный список
print(my_2lvl_list[0][0])   # 1 — первый элемент первого вложенного списка
print(my_2lvl_list[1][-1])  # с — последний элемент второго вложенного списка

1.3 Изменение элемента списка по индексу


Поскольку кортежи и строки у нас неизменяемые коллекции, то по индексу мы можем только брать элементы, но не менять их:

my_tuple = (1, 2, 3, 4, 5)
print(my_tuple[0])	  # 1
my_tuple[0] = 100         # TypeError: 'tuple' object does not support item assignment

А вот для списка, если взятие элемента по индексу располагается в левой части выражения, а далее идёт оператор присваивания =, то мы задаём новое значение элементу с этим индексом.

my_list = [1, 2, 3, [4, 5]]
my_list[0] = 10
my_list[-1][0] = 40
print(my_list)      	# [10, 2, 3, [40, 5]]

UPD: Примечание: Для такого присвоения, элемент уже должен существовать в списке, нельзя таким образом добавить элемент на несуществующий индекс.

my_list = [1, 2, 3, 4, 5]
my_list[5] = 6      # IndexError: list assignment index out of range


2 Срезы


2.1 Синтаксис среза


Очень часто, надо получить не один какой-то элемент, а некоторый их набор ограниченный определенными простыми правилами — например первые 5 или последние три, или каждый второй элемент — в таких задачах, вместо перебора в цикле намного удобнее использовать так называемый срез (slice, slicing).

Следует помнить, что взяв элемент по индексу или срезом (slice) мы не как не меняем исходную коллекцию, мы просто скопировали ее часть для дальнейшего использования (например добавления в другую коллекцию, вывода на печать, каких-то вычислений). Поскольку сама коллекция не меняется — это применимо как к изменяемым (список) так и к неизменяемым (строка, кортеж) последовательностям.

Синтаксис среза похож на таковой для индексации, но в квадратных скобках вместо одного значения указывается 2-3 через двоеточие:

my_collection[start:stop:step]  # старт, стоп и шаг

Особенности среза:


  • Отрицательные значения старта и стопа означают, что считать надо не с начала, а с конца коллекции.
  • Отрицательное значение шага — перебор ведём в обратном порядке справа налево.
  • Если не указан старт [:stop:step]— берём с самого начала коллекции, то есть start = 0
    Если не указан стоп [start:: step] — идем до самого конца коллекции, то есть stop = 0
  • step = 1, то есть последовательный перебор слева направо указывать не обязательно — это значение шага по умолчанию. В таком случае достаточно указать [start:stop]
  • Можно сделать даже так [:] — это значит взять коллекцию целиком
  • ВАЖНО: При срезе, первый индекс входит в выборку, а второй нет! То есть от старта включительно, до стопа, где стоп не включается в результат. Математически это можно было бы записать как [start, stop)

Примеры срезов в виде таблицы:


image

Код примеров из таблицы
col = 'abcdefg'
print(col[:])       # abcdefg
print(col[::-1])    # gfedcba
print(col[::2])     # aceg
print(col[1::2])    # bdf
print(col[:1])      # a
print(col[-1:])     # g
print(col[3:4])     # d
print(col[-3:])     # efg
print(col[-3:1:-1]) # edc
print(col[2:5])     # cde

2.2. Именованные срезы


Чтобы избавится от «магических констант», особенно в случае, когда один и тот же срез надо применять многократно, можно задать константы с именованными срезами с пользованием специальной функции slice()()

Примечание: Nonе соответствует опущенному значению по-умолчанию. То есть [:2] становится slice(None, 2), а [1::2] становится slice(1, None, 2).

person = ('Alex', 'Smith', "May", 10, 1980)
NAME, BIRTHDAY = slice(None, 2), slice(2, None)       
	# задаем константам именованные срезы
        # данные константы в квадратных скобках заменятся соответствующими срезами
print(person[NAME])      # ('Alex', 'Smith')
print(person[BIRTHDAY])  # ('May', 10, 1980)

my_list = [1, 2, 3, 4, 5, 6, 7]
EVEN = slice(1, None, 2)
print(my_list[EVEN])     # [2, 4, 6]

2.3 Изменение списка срезом


Важный момент, на котором не всегда заостряется внимание — с помощью среза можно не только получать копию коллекции, но в случае списка можно также менять значения элементов, удалять и добавлять новые.

Проиллюстрируем это на примерах ниже:


  • Даже если хотим добавить один элемент, необходимо передавать итерируемый объект, иначе будет ошибка TypeError: can only assign an iterable

    my_list = [1, 2, 3, 4, 5]
    # my_list[1:2] = 20     # TypeError: can only assign an iterable
    my_list[1:2] = [20]     # Вот теперь все работает
    print(my_list)          # [1, 20, 3, 4, 5]
    

  • Для вставки одиночных элементов можно использовать срез, код примеров есть ниже, но делать так не рекомендую, так как такой синтаксис хуже читать. Лучше использовать методы списка .append() и .insert():

    Срез аналоги .append() и insert()
    my_list = [1, 2, 3, 4, 5]
    my_list[5:] = [6]      # вставляем в конец — лучше использовать .append(6)
    print(my_list)         # [1, 2, 3, 4, 5, 6]
    my_list[0:0] = [0]     # вставляем в начало — лучше использовать .insert(0, 0)
    print(my_list)         # [0, 1, 2, 3, 4, 5, 6]
    my_list[3:3] = [25]    # вставляем между элементами — лучше использовать .insert(3, 25)
    print(my_list)         # [0, 1, 2, 25, 3, 4, 5, 6]
    

  • Можно менять части последовательности — это применение выглядит наиболее интересным, так как решает задачу просто и наглядно.

    my_list = [1, 2, 3, 4, 5]
    my_list[1:3] = [20, 30]
    print(my_list)          # [1, 20, 30, 4, 5]
    my_list[1:3] = [0]      # нет проблем заменить два элемента на один
    print(my_list)          # [1, 0, 4, 5]
    my_list[2:] = [40, 50, 60]   # или два элемента на три
    print(my_list)               # [1, 0, 40, 50, 60]
    

  • Можно просто удалить часть последовательности

    my_list = [1, 2, 3, 4, 5]
    my_list[:2] = []    # или del my_list[:2]
    print(my_list)      # [3, 4, 5]
    

2.4 Выход за границы индекса


Обращение по индексу по сути является частным случаем среза, когда мы обращаемся только к одному элементу, а не диапазону. Но есть очень важное отличие в обработке ситуации с отсутствующим элементом с искомым индексом.

Обращение к несуществующему индексу коллекции вызывает ошибку:

my_list = [1, 2, 3, 4, 5]
print(my_list[-10])       # IndexError: list index out of range
print(my_list[10])        # IndexError: list index out of range

А в случае выхода границ среза за границы коллекции никакой ошибки не происходит:

my_list = [1, 2, 3, 4, 5]
print(my_list[0:10])      # [1, 2, 3, 4, 5] — отработали в пределах коллекции
print(my_list[10:100])	  # [] - таких элементов нет — вернули пустую коллекцию
print(my_list[10:11])     # [] - проверяем 1 отсутствующий элемент - пустая коллекция, без ошибки


Примечание: Для тех случаев, когда функционала срезов недостаточно и требуются более сложные выборки, можно воспользоваться синтаксисом выражений-генераторов, рассмотрению которых посвещена 4 статья цикла.

3 Сортировка элементов коллекции


Сортировка элементов коллекции важная и востребованная функция, постоянно встречающаяся в обычных задачах. Тут есть несколько особенностей, на которых не всегда заостряется внимание, но которые очень важны.

3.1 Функция sorted()


Мы может использовать функцию sorted() для вывода списка сортированных элементов любой коллекции для последующее обработки или вывода.

  • функция не меняет исходную коллекцию, а возвращает новый список из ее элементов;
  • не зависимо от типа исходной коллекции, вернётся список (list) ее элементов;
  • поскольку она не меняет исходную коллекцию, ее можно применять к неизменяемым коллекциям;
  • Поскольку при сортировке возвращаемых элементов нам не важно, был ли у элемента некий индекс в исходной коллекции, можно применять к неиндексированным коллекциям;
  • Имеет дополнительные не обязательные аргументы:
    reverse=True — сортировка в обратном порядке
    key=funcname (начиная с Python 2.4) — сортировка с помощью специальной функции funcname, она может быть как стандартной функцией Python, так и специально написанной вами для данной задачи функцией и лямбдой.

my_list = [2, 5, 1, 7, 3]
my_list_sorted = sorted(my_list)
print(my_list_sorted)       # [1, 2, 3, 5, 7]

my_set = {2, 5, 1, 7, 3}
my_set_sorted = sorted(my_set, reverse=True)
print(my_set_sorted)        # [7, 5, 3, 2, 1]

Пример сортировки списка строк по длине len() каждого элемента:

my_files = ['somecat.jpg', 'pc.png', 'apple.bmp', 'mydog.gif']
my_files_sorted = sorted(my_files, key=len)
print(my_files_sorted)      # ['pc.png', 'apple.bmp', 'mydog.gif', 'somecat.jpg']

3.2 Функция reversed()


Функция reversed() применяется для последовательностей и работает по другому:

  • возвращает генератор списка, а не сам список;
  • если нужно получить не генератор, а готовый список, результат можно обернуть в list() или же вместо reversed() воспользоваться срезом [: :-1];
  • она не сортирует элементы, а возвращает их в обратном порядке, то есть читает с конца списка;
  • из предыдущего пункта понятно, что если у нас коллекция неиндексированная — мы не можем вывести её элементы в обратном порядке и эта функция к таким коллекциям не применима — получим «TypeError: argument to reversed() must be a sequence»;
  • не позволяет использовать дополнительные аргументы — будет ошибка «TypeError: reversed() does not take keyword arguments».

my_list = [2, 5, 1, 7, 3]
my_list_sorted = reversed(my_list)
print(my_list_sorted)           # <listreverseiterator object at 0x7f8982121450>
print(list(my_list_sorted))     # [3, 7, 1, 5, 2]
print(my_list[::-1])            # [3, 7, 1, 5, 2] - тот же результат с помощью среза

3.3 Методы списка .sort() и .reverse()


У списка (и только у него) есть особые методы .sort() и .reverse() которые делают тоже самое, что соответствующие функции sorted() и reversed(), но при этом:

  • Меняют сам исходный список, а не генерируют новый;
  • Возвращают None, а не новый список;
  • поддерживают те же дополнительные аргументы;
  • в них не надо передавать сам список первым параметром, более того, если это сделать — будет ошибка — не верное количество аргументов.

my_list = [2, 5, 1, 7, 3]
my_list.sort()
print(my_list)          # [1, 2, 3, 5, 7]

Обратите внимание: Частая ошибка начинающих, которая не является ошибкой для интерпретатора, но приводит не к тому результату, который хотят получить.

my_list = [2, 5, 1, 7, 3]
my_list = my_list.sort()
print(my_list)          # None

3.4 Особенности сортировки словаря


В сортировке словаря есть свои особенности, вызванные тем, что элемент словаря — это пара ключ: значение.

UPD: Так же, не забываем, что говоря о сортировке словаря, мы имеем ввиду сортировку полученных из словаря данных для вывода или сохранения в индексированную коллекцию. Сохранить данные сортированными в самом стандартном словаре не получится, они в нем, как и других неиндексированных коллекциях находятся в произвольном порядке.

  • sorted(my_dict) — когда мы передаем в функцию сортировки словарь без вызова его дополнительных методов — идёт перебор только ключей, сортированный список ключей нам и возвращается;
  • sorted(my_dict.keys()) — тот же результат, что в предыдущем примере, но прописанный более явно;
  • sorted(my_dict.items()) — возвращается сортированный список кортежей (ключ, значение), сортированных по ключу;
  • sorted(my_dict.values()) — возвращается сортированный список значений

my_dict = {'a': 1, 'c': 3, 'e': 5, 'f': 6, 'b': 2, 'd': 4}
mysorted = sorted(my_dict)
print(mysorted)           # ['a', 'b', 'c', 'd', 'e', 'f']
mysorted = sorted(my_dict.items())
print(mysorted)           # [('a', 1), ('b', 2), ('c', 3), ('d', 4), ('e', 5), ('f', 6)]
mysorted = sorted(my_dict.values())
print(mysorted)           # [1, 2, 3, 4, 5, 6]

Отдельные сложности может вызвать сортировка словаря не по ключам, а по значениям, если нам не просто нужен список значений, и именно выводить пары в порядке сортировки по значению.

Для решения этой задачи можно в качестве специальной функции сортировки передавать lambda-функцию lambda x: x[1] которая из получаемых на каждом этапе кортежей (ключ, значение) будет брать для сортировки второй элемент кортежа.

population = {"Shanghai": 24256800, "Karachi": 23500000, "Beijing": 21516000, "Delhi": 16787941}
# отсортируем по возрастанию населения:
population_sorted = sorted(population.items(), key=lambda x: x[1])
print(population_sorted)
# [('Delhi', 16787941), ('Beijing', 21516000), ('Karachi', 23500000), ('Shanghai', 24256800)]


UPD от ShashkovS: 3.5 Дополнительная информация по использованию параметра key при сортировке


Допустим, у нас есть список кортежей названий деталей и их стоимостей.
Нам нужно отсортировать его сначала по названию деталей, а одинаковые детали по убыванию цены.

shop = [('каретка', 1200), ('шатун', 1000), ('седло', 300),
        ('педаль', 100), ('седло', 1500), ('рама', 12000),
        ('обод', 2000), ('шатун', 200), ('седло', 2700)]

def prepare_item(item):
    return (item[0], -item[1])

shop.sort(key=prepare_item)

Результат сортировки
for det, price in shop:
    print('{:<10} цена: {:>5}р.'.format(det, price))

# каретка    цена:  1200р.
# обод       цена:  2000р.
# педаль     цена:   100р.
# рама       цена: 12000р.
# седло      цена:  2700р.
# седло      цена:  1500р.
# седло      цена:   300р.
# шатун      цена:  1000р.
# шатун      цена:   200р.

Перед тем, как сравнивать два элемента списка к ним применялась функция prepare_item, которая меняла знак у стоимости (функция применяется ровно по одному разу к каждому элементу. В результате при одинаковом первом значении сортировка по второму происходила в обратном порядке.

Чтобы не плодить утилитарные функции, вместо использования сторонней функции, того же эффекта можно добиться с использованием лямбда-функции.

# Данные скопировать из примера выше
shop.sort(key=lambda x: (x[0], -x[1]))

Дополнительные детали и примеры использования параметра key:

UPD от ShashkovS: 3.6 Устойчивость сортировки


Допустим данные нужно отсортировать сначала по столбцу А по возрастанию, затем по столбцу B по убыванию, и наконец по столбцу C снова по возрастанию.

Если данные в столбце B числовые, то при помощи подходящей функции в key можно поменять знак у элементов B, что приведёт к необходимому результату.
А если все данные текстовые? Тут есть такая возможность.
Дело в том, что сортировка sort в Python устойчивая (начиная с Python 2.2), то есть она не меняет порядок «одинаковых» элементов.

Поэтому можно просто отсортировать три раза по разным ключам:
data.sort(key=lambda x: x['C'])
data.sort(key=lambda x: x['B'], reverse=True)
data.sort(key=lambda x: x['А'])

Дополнительная информация по устойчивости сортировки и примеры: wiki.python.org/moin/HowTo/Sorting#Sort_Stability_and_Complex_Sorts (на наглийском).
Часть 1 Часть 2 Часть 3 Часть 4

Приглашаю к обсуждению:


  • Если я где-то допустил неточность или не учёл что-то важное — пишите в комментариях, важные комментарии будут позже добавлены в статью с указанием вашего авторства.
  • Если какие-то моменты не понятны и требуется уточнение — пишите ваши вопросы в комментариях — или я или другие читатели дадут ответ, а дельные вопросы с ответами будут позже добавлены в статью.
Александр @DaneSoul
карма
29,7
рейтинг 0,3
Веб-программирование, Python
Похожие публикации
Самое читаемое Разработка

Комментарии (34)

  • +2
    В прошлой статье вы исправили мутабельность/немутабельность на изменяемость/неизменяемость. Почему бы тогда слайс не исправить на срез? А слайсинг на срезинг
    • 0
      «Слайсы» на «срезы» переименовал, но «слайсинг» как обозначение процесса оставил, адекватного ему перевода, кроме как словосочетанием не вижу.
      • +1
        Внезапно, процесс тоже «срез»
        • 0
          Хорошо, «срез» так «срез» — везде поменял «слайсы» и «слайсинг» на «срезы»
      • 0
        Отглагольное существительное для глаголов «нарезать» (с обоими вариантами ударения) — очевидно, «нарезка».
        В кулинарии, между прочим, вовсю используется :)
        • 0
          Вопрос в том, насколько термин является общепринятым в программировании в конкретном контексте.
          Вот из-за таких неоднозначностей я лично всегда предпочитаю английский термин даже качественному его переводу на русский язык. Но судя по комментариям к этой и предыдущей статье, такой подход сообщество не разделяет, поэтому приходится искать компромиссы с русскими терминами.
          • 0
            Не, мне тоже нравится больше мутабельность и слайсинг. Я просто указал на нелогичность относительно прошлой статьи.
  • +1
    Хороший цикл статей. Читаю с удовольствием. Спасибо.
  • 0
    Было бы восхитительно, если была бы также приведена сложность алгоритма, где это уместно.
    Как например,
    l = [1, 2, 3, 4]  # List
    l.pop(0)          # -> 1 | O(n)
    l.pop()           # -> 4 | O(1)
    
    d = deque(l)  # Double-linked list
    d.popleft()   # -> 1 | O(1)
    d.pop()       # -> 4 | O(1)
    

    Получился бы отличный справочник.
    • 0
      В обсуждении первой части поднимался этот вопрос и были приведены ссылки на соответствующие материалы, которые я добавил в конец первой статьи.
  • +1
    Отличная статья!
    К примеру с сортировкой словаря по значениям c lambda — напоминалка: при преобразовании результата работы sorted обратно в словарь сортировка теряется, поскольку словарь является коллекцией неиндексированной.
    • 0
      Добавил напоминание о неиндексированности словаря в начале подраздела «3.4 Особенности сортировки словаря»
  • +1
    Я бы ещё добавил про то, что сортировка устойчивая (и как этим пользоваться), а также как пользоваться параметром key.

    Допустим, у нас есть список названий деталей и их стоимостей. Нам нужно отсортировать его сначала по названию деталей, а одинаковые детали по убыванию цены. Самая коротка реализация даст не совсем тот результат:
    shop = [('каретка', 1200), ('шатун', 1000), ('седло', 300), 
            ('педаль', 100), ('седло', 1500), ('рама', 12000), 
            ('обод', 2000), ('шатун', 200), ('седло', 2700)]
    shop.sort()
    for det, price in shop:
        print('{:<10} цена: {:>5}р.'.format(det, price))
    каретка    цена:  1200р.
    обод       цена:  2000р.
    педаль     цена:   100р.
    рама       цена: 12000р.
    седло      цена:   300р.
    седло      цена:  1500р.
    седло      цена:  2700р.
    шатун      цена:   200р.
    шатун      цена:  1000р.
    


    Это можно исправить так:

    def prepare_item(item):
        return (item[0], -item[1])
    
    shop = [('каретка', 1200), ('шатун', 1000), ('седло', 300), 
            ('педаль', 100), ('седло', 1500), ('рама', 12000), 
            ('обод', 2000), ('шатун', 200), ('седло', 2700)]
    shop.sort(key=prepare_item)
    for det, price in shop:
        print('{:<10} цена: {:>5}р.'.format(det, price))
    каретка    цена:  1200р.
    обод       цена:  2000р.
    педаль     цена:   100р.
    рама       цена: 12000р.
    седло      цена:  2700р.
    седло      цена:  1500р.
    седло      цена:   300р.
    шатун      цена:  1000р.
    шатун      цена:   200р.
    


    Что здесь произошло? Перед тем, как сравнивать два элемента списка к ним применялась функция prepare_item, которая меняла знак у стоимости (функция применяется ровно по одному разу к каждому элементу. Здесь отличие от подхода с функцией-сравнивателем в python 2 или C++, которая вызывается столько раз, сколько выполняется сравнение). В результате при одинаковом первом значении сортировка по второму происходила в обратном порядке.

    Ещё можно использовать лямбды или itemgetter'ы:
    shop.sort(key=lambda x: (x[0], -x[1]))
    
    my_list = [39, 12, 21, 77, 21, 51, 48, 21, 42, 76]
    hacked_list = sorted(enumerate(my_list), key=lambda x:x[1])
    # Или так
    from operator import itemgetter
    hacked_list = sorted(enumerate(my_list), key=itemgetter(1))
    


    Ещё один способ хитрых сортировок

    Допустим данные нужно отсортировать сначала по столбцу А по возрастанию, затем по столбцу Б по убыванию, и наконец по столбцу В снова по возрастанию. Если данные в столбце Б числовые, то при помощи подходящей функции в key можно поменять знак у элементов Б, что приведёт к необходимому результату. А если все данные текстовые? Тут есть такая возможность. Дело в том, что сортировка sort в Python устойчивая, то есть она не меняет порядок «одинаковых» элементов. Поэтому можно просто отсортировать три раза по разным ключам:
    data.sort(key=lambda x: x['В'])
    data.sort(key=lambda x: x['Б'], reverse=True)
    data.sort(key=lambda x: x['А'])
    


    PS. https://shapyto.ru/ — для совсем новичков, но с подкапотными подробностями, делал для коллег по работе;
    А ещё есть божественный визуализатор от Philip Guo.
    • +1
      Ещё иллюстрация работы сортировки с key:
      Код
      class MyTuple(tuple):  # Поправим несколько стандартных методов
          def __new__(cls, *p):  # tuple неизменяемый, поэтому определяем __new__
              return super().__new__(cls, p)
          def __lt__(self, other):  # Будем делать принт при сравнениях. При сортировке используется только <=
              print('Сравниваем', self, 'c', other)
              return super().__lt__(other)  # Да, кстати, super() — это класс tuple
          def __str__(self):  # Меняем str, чтобы отличать от обычного кортежа
              return '<' + repr(self) + '>'
      
      def inverse_price(item):
          res = MyTuple(item[0], -item[1])  # Делаем лжекортеж, чтобы отслеживать факты сравнений
          print('Функцию inverse_price вызвали с параметром', item, 'Мы вернули', res)
          return res
      
      shop = [('каретка', 1200), ('шатун', 1000), ('седло', 300),
              ('педаль', 100), ('седло', 1500), ('рама', 12000),
              ('обод', 2000), ('шатун', 200), ('седло', 2700)]
      
      shop.sort(key=inverse_price)
      


      Результат
      Функцию inverse_price вызвали с параметром ('каретка', 1200) Мы вернули <('каретка', -1200)>
      Функцию inverse_price вызвали с параметром ('шатун', 1000) Мы вернули <('шатун', -1000)>
      Функцию inverse_price вызвали с параметром ('седло', 300) Мы вернули <('седло', -300)>
      Функцию inverse_price вызвали с параметром ('педаль', 100) Мы вернули <('педаль', -100)>
      Функцию inverse_price вызвали с параметром ('седло', 1500) Мы вернули <('седло', -1500)>
      Функцию inverse_price вызвали с параметром ('рама', 12000) Мы вернули <('рама', -12000)>
      Функцию inverse_price вызвали с параметром ('обод', 2000) Мы вернули <('обод', -2000)>
      Функцию inverse_price вызвали с параметром ('шатун', 200) Мы вернули <('шатун', -200)>
      Функцию inverse_price вызвали с параметром ('седло', 2700) Мы вернули <('седло', -2700)>
      Сравниваем <('шатун', -1000)> c <('каретка', -1200)>
      Сравниваем <('седло', -300)> c <('шатун', -1000)>
      Сравниваем <('седло', -300)> c <('шатун', -1000)>
      Сравниваем <('седло', -300)> c <('каретка', -1200)>
      Сравниваем <('педаль', -100)> c <('седло', -300)>
      Сравниваем <('педаль', -100)> c <('каретка', -1200)>
      Сравниваем <('седло', -1500)> c <('седло', -300)>
      Сравниваем <('седло', -1500)> c <('педаль', -100)>
      Сравниваем <('рама', -12000)> c <('седло', -1500)>
      Сравниваем <('рама', -12000)> c <('педаль', -100)>
      Сравниваем <('обод', -2000)> c <('седло', -1500)>
      Сравниваем <('обод', -2000)> c <('педаль', -100)>
      Сравниваем <('обод', -2000)> c <('каретка', -1200)>
      Сравниваем <('шатун', -200)> c <('рама', -12000)>
      Сравниваем <('шатун', -200)> c <('седло', -300)>
      Сравниваем <('шатун', -200)> c <('шатун', -1000)>
      Сравниваем <('седло', -2700)> c <('седло', -1500)>
      Сравниваем <('седло', -2700)> c <('педаль', -100)>
      Сравниваем <('седло', -2700)> c <('рама', -12000)>
      

    • 0
      Огромное спасибо за Ваши очень ценные дополнения в комментариях к моим статьям!
      Добавил основную часть информации из Вашего комментария в конце статьи с указанием Вашего авторства.

      Здесь отличие от подхода с функцией-сравнивателем в python 2 или C++, которая вызывается столько раз, сколько выполняется сравнение

      От С++ и я и тема статьи далеки, а вот касательно Python 2, не могли бы Вы уточнить, что именно имеется в виду? Я поверял Ваш код в Python 2.7 и Python 3.5 — он дает одинаковый результат.
  • +1
    > Математически это можно было бы записать как [start, stop)

    интересно почему так, странный подход, ИМХО логичнее [start, stop]
    • 0
      Наверно потому что
      a[x: z] = a[x: y] + a[y: z]
      • 0
        Забыл написать, что статья очень хорошая, спасибо автору!
      • +1
        не понимаю о чём вы
        • +1
          В данном случае номер элемента y является разделителем на две части: «от x до y» и «от y до z».
          То есть, элемент с номером y должен войти только в одну из частей, иначе a[x: y] + a[y: z] не будет равно a[x: z].

          Объединить в непрерывную последовательность можно только лучи, но не отрезки, иначе будет дублирование концов.
          Поэтому выбрана такая нотация — в силу того, что последовательность номеров элементов непрерывна, и мы знаем, что после x-го элемента обязательно должен идти x+1-й.

          В других случаях такой гарантии нет, и там используется нотация [start, stop], потому что мы можем не знать следующий после stop индекс.
          Такая ситуация, например, в индексировании Series и Dataframe в pandas.
          • 0
            Ну некоторая логика в этом есть, хотя подозреваю что такое применение сильно реже приходится использовать чем запись a[x:y+1]
    • +1
      • 0
        Жму руку, вот это я и хотел узнать
  • +1
    Мне кажется, что в срезах еще одного параметра не хватает.
    Есть начало, конец, шаг и неплохо было бы добавить что-то типа «длины выборки (length)».
    То есть задавать срез в виде [start: stop: step: length].
    Это удобно для таких задач как «выбрать по n через m» («бригада 3 дня работает, два отдыхает — выбрать рабочие дни месяца»).
    Для приведенной в статье последовательности 'abcdefg' срез [::: 2] даст (дал бы) 'abdeg', а срез [:: 2: 2] — 'abef'.
    • 0
      Слишком неочевидная логика получается, даже приведенный Вами в конце пример мне не понятен — почему должны получится именно эти последовательности? Что вообще будет значить длина выборки, если у нас start: stop: step дефолтные, то есть последовательность целиком?
      Если фильтрация такая комплексная, ее можно сделать проходом в цикле со сложным набором условий — это будет понятней выглядеть, чем такой синтаксис.
      • 0
        Да, согласен с тем, что данное предложение надо тщательнее проработать. И наверное, правильнее все-таки рассматривать step как фиксированную длину цикла, на которую добавляемый параметр не влияет (выше я рассматривал другой вариант — там длина цикла складывалась как step+length, — наверное, это действительно менее ясно и гибко).

        В текущей реализации (три параметра start: stop: step) подразумевается, что длина выборки всегда единица (как и шаг). То есть мы перебираем индекс от начала (start) до конца (stop) с шагом (step) и возвращаем всегда один элемент, на который указывает индекс. Этот элемент вставляется в возвращаемую последовательность.

        Предложение в том, чтобы добавить еще один параметр, который даст возможность регулировать — что именно надо возвращать. Самый простой (дубовый) вариант — четвертым параметром просто указываем длину возвращаемой выборки на каждом шаге.
        Например, запись [::7:5] означает, что при шаге (цикле) 7 надо возвращать 5 элементов — (рабочие дни недели). А
        Если длина выборки больше, чем остаток — возвращаем остаток.
        При таком варианте длина возвращаемой выборки может быть больше чем цикл. Для последовательности 'abcdefg' срез [::1:2] даст 'abbccddeeffgg'.

        Но и данный вариант не самый гибкий. То есть он не позволяет задать выборку, например, такого типа — «выбрать числа, на которые приходятся в данном месяце понедельник, среда, пятница». То есть когда выборка сама имеет структуру.
        Поэтому наверное, самым правильным будет в качестве 4-го параметра указывать другой срез (получаем срез внутри среза). Не запутал окончательно? ).

        Первый срез определяет цикл выборки, а второй работает внутри данного цикла.
        Тогда указанный выше выбор 1-го, 3-го и 5-го элемента недели можно записать так:
        [:: 7: [:6:2] ]. То есть мы указываем шаг 7 (длина недели), и срез внутри недели — [:6:2] — от первого до 6-го элементов выбери через 1.

        Данный вариант тоже много вопросов вызовет (например, может ли быть индекс внутреннего среза больше чем шаг внешнего). Но такая запись, наверное, покроет все возможные варианты срезов.
        • 0
          Если даже сама постановка вопроса не всегда понятна и трактуется однозначно, значит задачу стоит разделить на несколько более простых и понятных этапов. Собственно подобный принцип стремления к понятности кода лежит в основе философии Python.
           # Формируем список дней от 1 до 31 с которым будем работать
          days = [d for d in range(1, 32)]   
          
          # Делим список дней на недели
          weeks = [days[i:i+7] for i in range(0, len(days), 7)]   
          print(weeks)   # [[1, 2, 3, 4, 5, 6, 7], [8, 9, 10, 11, 12, 13, 14], [15, 16, 17, 18, 19, 20, 21], [22, 23, 24, 25, 26, 27, 28], [29, 30, 31]]
          
          # Выбираем в каждой неделе только первые 5 рабочих дней, отбрасывая остальные
          work_weeks = [week[0:5] for week in weeks]   
          print(work_weeks)   # [[1, 2, 3, 4, 5], [8, 9, 10, 11, 12], [15, 16, 17, 18, 19], [22, 23, 24, 25, 26], [29, 30, 31]]
          
          # Если нужно одним списком дней - можно объединить
          wdays = [item for sublist in work_weeks for item in sublist]
          print(wdays)   # [1, 2, 3, 4, 5, 8, 9, 10, 11, 12, 15, 16, 17, 18, 19, 22, 23, 24, 25, 26, 29, 30, 31]
          

          Вообще, большое спасибо за поднятый вопрос — я как раз сейчас пишу статью по генерации списков (планирую опубликовать до конца месяца), и вот этот пример с рабочими днями очень показателен, обязательно его туда добавлю!
          • 0
            Кстати, можно убрать выходные еще более изящно, используя индексы
            # Формируем список дней от 1 до 31 с которым будем работать
            days = [d for d in range(1, 32)] ]
            
            wdays6 = [wd for (i, wd) in enumerate(days, 1) if i % 7 != 0]  # Удаляем каждый 7-й день
            # Удаляем каждый 6 день в оставшихся после первого удаления:
            wdays5 = [wd for (i, wd) in enumerate(wdays6, 1) if i % 6 != 0]  
            
            print(wdays5)
            # [1, 2, 3, 4, 5, 8, 9, 10, 11, 12, 15, 16, 17, 18, 19, 22, 23, 24, 25, 26, 29, 30, 31]
            

            Обратите внимание, что просто объединить два условия в одном if не получится, как минимум потому, что 12-й день делится на 6, но не выпадает на последний 2 дня недели!
            • 0
              Неплохо, да. Хотя я бы наверное по другому сделал, но не суть.
              Понятно, что задачу произвольной выборки элементов последовательности в принципе можно решить многими способами различной степени изящности.

              Просто когда я просматривал статью и увидел табличку с примерами работы срезов, то вспомнил про «периодические выборки» (сталкивался с ними) и понял, что текущими срезами Питона их не получить. Вот и возникло предложение про 4-й параметр срезов.
              • 0
                ИМХО, срезы в принципе не задумывались для сложных комплексных выборок с условиями — для этих целей существуют генераторы выражений (list comprehensions). Вот там намного больше простора для творчества и гибких изящных решений. А там, где задача настолько сложна, что не хватает и генераторов — уже нужно писать циклы с ветвлением условий, чтобы не получился сверхкомпактный «write only» код.

                В следующей моей статье из этого цикла как-раз будут рассматриваться генераторы выражений, и там в процессе написания уже встает много очень интересных применений.
                Если есть еще какие интересные идеи или задачи на эту тему — пишите в личку, могу попробовать осветить их в следующей статье.
                • 0
                  Если бы разработчики питона остановились на двух параметрах среза (start:stop), то и вопросов бы не возникло. В этом случае мы действительно имеем дело с «чистыми срезами».
                  Фактически такой срез является интервалом с двумя границами. Причем в общем случае границы необязательно должны быть целыми числами (для срезов произвольных интервалов).

                  Но третий параметр (step) выводит нас из зоны срезов в зону периодических выборок. Это еще не произвольные выборки, но уже и не срезы.
                  И именно поэтому имело бы смысл довести дело до конца, то есть сделать такие периодические выборки универсальными, введя 4-й параметр (характеристику выборки), который в свою очередь тоже может быть срезом. Тогда все замыкается.

                  Это не универсальные выборки по любому критерию, а именно периодические.
                  В любом случае, конечно, их можно реализовать «руками».
                  • 0
                    Разница в сложности понимания концепции — текущий step — не вызывает неоднозначностей — есть диапазон по start и stop и есть частота выбора из диапазона, плюс, наличие шага позволяет его делать отрицательным и разворачивать направление выборки.
                    Таким образом третий параметр шага прост и очевиден для понимания, плюс имеет кучу реальных применений в распространенных задачах, которые оправдывают его наличие.

                    Введение четвертого параметра привело бы к наличию двух параметров для выборки, соответственно возникает неоднозначность с порядком их применения и с предугадыванием возможных коллизий — вместо простого и понятного инструмента получим головоломку, особенно с учетом того, что срезы часто применяются не сами по себе, а в составе более сложных выражений.

                    Так что я за то, для случаев когда одного критерия выборки недостаточно — разбивать задачу на две, фильтруя последовательно по одному критерию, затем по другому.
                    • 0
                      ) На всякий случай — я не настаиваю, в моей жизни и работе ничего не изменится от того, появится четвертый параметр в срезах питона или нет ).

                      Но я не понимаю, как может запутать параметр, который необязателен к использованию? Не нужны параметры периодической выборки — не задавайте, — работайте как обычно. А зачем лишать возможно полезного функционала тех, кому он мог бы пригодиться?

                      К тому же тут не просто функционал, тут еще и рекурсивное замыкание функционала. Это всегда красиво, но не всегда реализуемо.

                      Сорри, но я вроде бы все уже сказал и больше не буду эту ветку поддерживать. Спасибо ).
                      И отдельное спасибо за статьи, конечно ).
  • 0
    Не нужны параметры периодической выборки — не задавайте, — работайте как обычно. А зачем лишать возможно полезного функционала тех, кому он мог бы пригодиться?

    Ага, а потом нужно чужой код подправить, открываешь, а там трехэтажные конструкции цепочкой выстроенные со всеми возможными параметрами…
    Не, хорошо читаемый язык (а это есть в философии Python) не должен позволять стрелять в ногу из зенитки — за то и люблю Python, что тут PEP 8 даже правильность отступов определяет.

    PS: Спасибо за интересную дискуссию и хороший пример для следующей статьи.

Только зарегистрированные пользователи могут оставлять комментарии. Войдите, пожалуйста.