Перейти к основному содержимому
Перейти к основному содержимому

CityHash

ClickHouse использует одну из предыдущих версий CityHash от Google.

к сведению

CityHash изменил алгоритм после того, как мы добавили его в ClickHouse.

Документация CityHash специально отмечает, что пользователь не должен полагаться на конкретные значения хешей и не должен сохранять их где-либо или использовать в качестве ключа шардирования.

Но поскольку мы открыли эту функцию для пользователей, нам пришлось зафиксировать версию CityHash (на 1.0.2). И теперь мы гарантируем, что поведение функций CityHash, доступных в SQL, не изменится.

— Алексей Миловидов

Заметка

Текущая версия CityHash от Google отличается от варианта cityHash64 в ClickHouse.

Не используйте farmHash64 для получения значения CityHash от Google! FarmHash является преемником CityHash, но они не полностью совместимы.

СтрокаClickHouse64CityHash64FarmHash64
Москва1250790149629287863859927100784533574095992710078453357409
Как можно написать большую систему без C++? -Пол Глик623794531165004562574929116295744250411716470977470720228

Также смотрите Представляем CityHash для описания и обоснования создания. TL;DR некриптографический хеш, который быстрее, чем MurmurHash, но более сложный.

Реализации

Go

Вы можете использовать пакет go-faster/city, который реализует обе версии.