Excel - Удаление дублей.
  • Гуру Экселя, помогите решить непосильную задачу.

    Дано:
    Документ на ~20 тыс. строк содержащий некоторое кол-во дублей.
    Задача:
    Необходимо удалить из этого документа дублируемые и дублирующие строки!
    Грубо говоря, было 2 документа немного отличающихся друг от друга, их объединили в один и теперь необходимо вычленить лишь то, что их отличало друг от друга.

    Заранее спасибо за помощь.

    P.S. Excel 2003.
  • Данные - фильтр - расширенный фильтр - только уникальные записи
  • В 2007-м:
    1 способ. Вкладка "Данные", группа "Работа с данными", пункт "Удалить дубликаты"
    2 способ. Это если вручную и хочется узнать, какие именно дубли и сколько их... Функция "СЧЁТЕСЛИ". Ее аргументы - диапазон и критерий. С критерием все просто - ставим относительную ссылку на ячейку, которую надо "посчитать" (сколько раз значение входит в диапазон). Диапазон - тоже просто, но одна тонкость: чтобы он не "съезжал", его надо закрепить, то есть поставить абсолютные ссылки (делается с помощью F4). Если диапазон не закрепить, то при протягивании формулы он с каждой ячейкой будет съезжать на одну вниз и в итоге, в последней строке, диапазон будет состоять из одной строки. Создали формулу в одной ячейке - протянули на всю высоту диапазона. Включили автофильтр и в столбце результатов смотрим: если есть значения больше 1, то это дубликаты, и цифра обозначает, сколько раз встречается одно и то же значение. Ну а потом можно их отфильтровать и удалить.

    2-й работает и в 2003-м, 1-й - не помню, может и работает.
  • Данные - фильтр - расширенный фильтр - только уникальные записи

    Этот способ удаляет лишь дублирующие строки, а необходимо удалить и дублируемые и дублирующие строки!
  • необходимо удалить и дублируемые и дублирующие строки!

    СЧЁТЕСЛИ.
  • 2 способ. Это если вручную и хочется узнать, какие именно дубли и сколько их...

    Какие именно - не важно. Сколько их - не больше двух одинаковых строк. Это известно.

    Функция "СЧЁТЕСЛИ". Создали формулу в одной ячейке - протянули на всю высоту диапазона. Включили автофильтр и в столбце результатов смотрим: если есть значения больше 1, то это дубликаты, и цифра обозначает, сколько раз встречается одно и то же значение. Ну а потом можно их отфильтровать и удалить.

    Если честно не осилил. :(
    Т.е. я так понимаю, если нам не нужно знать сколько, то можно обойтись функцией 'ЕСЛИ'. Такая функция реализована мной как =ЕСЛИ(D2&E2=D3&E3;1;)
  • Т.е. я так понимаю, если нам не нужно знать сколько, то можно обойтись функцией 'ЕСЛИ'. Такая функция реализована мной как =ЕСЛИ(D2&E2=D3&E3;1;)

    Нет, просто "если" тут никак не поможет. Она отдает простую проверку некого условия. Вам нужна именно "СЧЁТЕСЛИ". Попробуйте ее вставить через меню вставки формул, там подсказки есть...
  • Какие именно - не важно. Сколько их - не больше двух одинаковых строк. Это известно.


    Если честно не осилил. :(
    Т.е. я так понимаю, если нам не нужно знать сколько, то можно обойтись функцией 'ЕСЛИ'. Такая функция реализована мной как =ЕСЛИ(D2&E2=D3&E3;1;)



    еще можно, если текст - выстроить по алфавиту и след. столбик СОВПАД тек.стр с пред. и второй столбик СОВПАД тек.стр. со след., результат (истина или ложь) скопировать и уже вставить в те же столбцы как значение, потом сортировка и удаление ненужного. Может нюансы упустил, но кажется должно сработать.
  • Благодарю всех откликнувшихся. Спасибо.
  • Как решили задачу-то?
  • Через функцию 'ЕСЛИ'. Отсортировал весь список по алфавиту и сравнил строки с предыдущими и последующими, в два этапа.

Привет, незнакомец!

Похоже, Вы новенький! Чтобы начать обсуждение, кликните на одну из кнопок ниже ;)

Войти с помощью OpenID

Категории

В этой теме: