Использование функции фильтра Python
Встроенная функция filter() Python может использоваться для создания нового итератора из существующего итерируемого объекта (например списка или словаря), который эффективно отфильтрует элементы с помощью предоставленной нами функции. Итерируемый объект — это объект Python, по которому можно выполнить итерацию, то есть он вернет элементы в такой последовательности, которую мы можем использовать в цикле for.
Базовый синтаксис для функции filter():
filter(function, iterable)
Copy
Это вернет итерируемый объект фильтра. Мы можем использовать функцию, например list(), для составления списка всех элементов, возвращенных в объекте фильтра.
Функция filter() обеспечивает способ фильтрации значений, который зачастую может быть более эффективным, чем генератор списка, особенно когда мы начинаем работу с большими наборами данных. Например, генератор списка составит новый список, что увеличит время этой обработки. Это означает, что после того, как генератор списка закончит выражение, у нас в памяти будет два списка. Однако filter() сделает простой объект, содержащий ссылку на оригинальный список, предоставляемую функцию и индекс пути в оригинальном списке, что занимает меньший объем памяти.
В этом обучающем модуле мы рассмотрим четыре разных способа использования filter(): с двумя различными итерируемыми структурами, с функцией lambda и без определенной функции.
Использование filter() с функцией
Первый аргумент в filter() — это функция, которую мы используем для решения о включении или фильтрации каждого элемента. Функция вызывается один раз для каждого элемента в итерируемом объекте, переданном как второй аргумент и каждый раз при возвращении False значение сбрасывается. Поскольку этот аргумент является функцией, мы можем либо передать обычную функцию, либо использовать функции lambda, особенно когда выражение является менее сложным.
Ниже приводится синтаксис lambda с filter():
filter(lambda item: item[] expression, iterable)
Copy
С помощью списка ниже можно включить функцию lambda с выражением, по которому мы хотим оценить каждый элемент из списка:
creature_names = ['Sammy', 'Ashley', 'Jo', 'Olly', 'Jackie', 'Charlie']
Copy
Чтобы отфильтровать этот список для поиска названий наших аквариумных созданий, начинающихся с гласной, мы можем запустить следующую функцию lambda:
print(list(filter(lambda x: x[0].lower() in 'aeiou', creature_names)))
Copy
Здесь мы заявляем в нашем списке элемент в качестве x. Затем мы настроим наше выражение для доступа к первому символу каждой строки (или символу «нуль»), то есть x[0]. Установка нижнего регистра в каждом из названий обеспечит соответствие букв строке в нашем выражении, 'aeiou'.
Наконец, мы передадим итерируемому объекту creature_names. Как и в предыдущем разделе, мы применяем list() к результату, чтобы создать список из возвратов итератора filter().
Вывод будет выглядеть следующим образом:
Output ['Ashley', 'Olly']
Этот же результат можно получить с помощью определяемой нами функции:
creature_names = ['Sammy', 'Ashley', 'Jo', 'Olly', 'Jackie', 'Charlie'] def names_vowels(x): return x[0].lower() in 'aeiou' filtered_names = filter(names_vowels, creature_names) print(list(filtered_names))
Copy
Наша функция names_vowels определяет выражение, которое мы будем применять для фильтра creature_names.
Снова, вывод будет выглядеть следующим образом:
Output ['Ashley', 'Olly']
В целом, функции lambda достигают того же результата с filter(), что и при использовании обычной функции. Необходимость определения обычной функции растет по мере увеличения сложности выражений для фильтрации наших данных, что, скорее всего, будет способствовать улучшению читабельности нашего кода.
Использование None с filter()
Мы можем передать None в качестве первого аргумента filter(), чтобы исключить из возвращенного фильтра итератора любые значения, которые Python считает «ложными». Обычно Python считает все значения длиной 0 (например пустой список или пустую строку) или числовой эквивалент 0 ложными, отсюда использование термина «ложный».
В следующем случае мы хотим фильтровать наш список так, чтобы отображались только номера номера емкостей в нашем аквариуме:
aquarium_tanks = [11, False, 18, 21, "", 12, 34, 0, [], {}]
Copy
В этом коде у нас есть список, содержащий целые числа, пустые последовательности и логическое значение.
filtered_tanks = filter(None, aquarium_tanks)
Copy
Мы используем функцию filter() с None и передадим список aquarium_tanks в качестве нашего итерируемого объекта. Поскольку мы передали None в качестве первого аргумента, проверим, считаются ли элементы в нашем списке ложными.
print(list(filtered_tanks))
Copy
Затем обернем filtered_tanks в функцию list() для возврата списка для filtered_tanks при печати.
Здесь мы видим, что вывод отображает только целые значения. Все элементы, оцененные как False, равные 0 по длине, были удалены filter():
Output [11, 25, 18, 21, 12, 34]
Примечание. Если мы не используем list() и печатаем filtered_tanks, мы получим объект фильтра вроде <filter object at 0x7fafd5903240>. Объект фильтра является итерируемым, поэтому мы можем пройтись по нему с помощью for или использовать list() для превращения его в список, который мы здесь делаем, так как это хороший способ проверки результатов.
C None мы использовали filter() для быстрого удаления элементов из нашего списка, которые считались ложными.
Использование filter() со списком словарей
Когда у нас имеется более сложная структура данных, мы все еще можем использовать filter() для оценки каждого из элементов. Например, если у нас есть список словарей, мы не только хотим выполнить итерацию по каждому элементу в списке — одному из словарей, — но мы также хотим выполнить итерацию по каждой паре key:value в словаре, чтобы оценить все данные.
Например, допустим, у нас есть список всех созданий в аквариуме с различными данными о каждом из них:
aquarium_creatures = [
{"name": "sammy", "species": "shark", "tank number": "11", "type": "fish"},
{"name": "ashley", "species": "crab", "tank number": "25", "type": "shellfish"},
{"name": "jo", "species": "guppy", "tank number": "18", "type": "fish"},
{"name": "jackie", "species": "lobster", "tank number": "21", "type": "shellfish"},
{"name": "charlie", "species": "clownfish", "tank number": "12", "type": "fish"},
{"name": "olly", "species": "green turtle", "tank number": "34", "type": "turtle"}
]
Copy
Мы хотим фильтровать эти данные по строке поиска, которую мы предоставили функции. Для доступа filter() к каждому словарю и каждому элементу в словарях, мы создадим вложенную функцию, например:
def filter_set(aquarium_creatures, search_string):
def iterator_func(x):
for v in x.values():
if search_string in v:
return True
return False
return filter(iterator_func, aquarium_creatures)
Copy
Мы определяем функцию filter_set(), которая принимает aquarium_creatures и search_string в качестве параметров. В filter_set() мы передадим iterator_func() в качестве функции filter(). Функция filter_set() вернет итератор, полученный от filter().
iterator_func() принимает x в качестве аргумента, представляющего элемент в нашем списке (т.е. единый словарь).
Затем цикл for получит доступ к каждой паре key:value в наших словарях, а затем будет использовать условное выражение для проверки того, есть ли search_string в v, представляя значение.
Как и в предыдущих примерах, если выражение оценивает значение как True, функция добавляет элемент в объект фильтра. Оно вернется после выполнения функции filter_set(). Мы расположим return False за пределами нашего цикла для проверки каждого элемента в каждом словаре вместо получения результатов после проверки одного первого словаря.
Мы вызовем filter_set() с нашим списком словарей и строкой поиска, для которых мы хотим найти совпадения:
filtered_records = filter_set(aquarium_creatures, "2")
Copy
После выполнения функции мы сохраним объект фильтра в переменной filtered_records, которую мы превращаем в список и печатаем:
print(list(filtered_records))
Copy
Мы увидим следующий вывод из этой программы:
Output
[{'name': 'ashley', 'species': 'crab', 'tank number': '25', 'type': 'shellfish'}, {'name': 'jackie', 'species': 'lobster', 'tank number': '21', 'type': 'shellfish'}, {'name': 'charlie', 'species': 'clownfish', 'tank number': '12', 'type': 'fish'}]
Мы отфильтровали список словарей по строке поиска 2. Мы видим, что вернулись три словаря, включающие номер емкости с 2. Использование нашей собственной вложенной функции позволило нам получить доступ к каждому элементу выполнить эффективную проверку относительно каждой строки поиска.