Суббота, Декабрь 15, 2018

Почему нет смысла реболлить ЧИПы

Обзор упаковки ЧИПа FC-BGA. Причины, следствия, выводы.

Почему нет смысла ребболить ЧИПы или описание процесса временного восстановления ЧИПа от нагрева.

Как всем давно уже известно, последние года для компании NVIDIA прошли не столь радужно. И дело тут не только в выпуске конкуретных продуктов, или достижений, каких-либо революционных в плане производительности устройств. Речь идёт о качестве выпускаемой продукции, как не банально это звучит. И именно на долю NVIDIA пришёлся колоссальный объём брака (дефектных ЧИПов). Официально история началась с :

 

Июль 2008г (официальный пресс релиз) :

NVIDIA представляет данные по второму кварталу финансового 2009 года

 

Компания уменьшает прогнозируемые финансовые результаты по второму кварталу и планирует покрыть расходы, связанные с работоспособностью ноутбуков

 

САНТА-КЛАРА, КАЛИФОРНИЯ—2 ИЮЛЯ, 2008—Компания NVIDIA (Nasdaq: NVDA), мировой лидер в области технологий визуальных вычислений, сегодня представила результаты деятельности за второй квартал, заканчивающийся 27 июля 2008 года.

...

  • NVIDIA планирует взять сумму в размере от 150 до 200 миллионов долларов из дохода за второй квартал, чтобы покрыть ожидаемые расходы на гарантийное обслуживание, ремонт, замену и т.д., из-за слабого материала ядра/упаковки некоторых версий GPU и MCP предыдущего поколения, которые устанавливались в ноутбуки. Некоторые конфигурации ноутбуков с GPU и MCP с определенными материалами ядрами/упаковками не работают чаще, чем обычно, тогда как сбои в случае других ноутбуков не замечены. NVIDIA провела переговоры со своими поставщиками по вопросу используемых материалов и будет пытаться получить страховую выплату по этому случаю.

...

Подробнее об одноразовой выплате по сбоям ноутбуков смотрите в текущем отчете NVIDIA по форме 8-K за 2 июля 2008 года, переданном в Комиссию по ценным бумагам и биржевым операциям.

...

Источник : http://www.nvidia.ru/object/io_1215163662355.html

На практике это оказалось только вершиной айсберга. Данная проблема затронула не только мобильный сектор продуктов NVIDIA, а также практически все десктопные продукты, производимые компанией. Но, также хотелось бы отметить, что данная проблема существовала и ранее, и частично, она затрагивала и других игроков IT рынка, в числе которых Intel, AMD, ATI (AMD), VIA, SIS и т.д. Но ранее это были единичные случаи, и вполне оправданный процент брака при используемой технологии производства.

Почему больше всех пострадала именно NVIDIA ? Каковы методы для её диагностики и почему так происходит ? Вот над этими вопросами предстоит разобраться и понять суть данной проблемы, а также сделать необходимые выводы из предложенного материала.

Сначала немного теории (плавный и постепенный подход к проблеме)

С увеличением степени интеграции ( уменьшением норм технологического процесса, увеличением количества компонентов, увеличением тепловыделения) индустрия требовала всё новых и новых технологий производства. Рождённый ещё в далёком 1960 году корпорацией IBM метод поверхностного монтажа компонентов (SMT/SMD) повлёк за собой целую линейку технологий изготовления и упаковки компонентов : PLCC, QFP, QFN и BGA.

BGA (англ. Ball grid array — массив шариков) — тип корпуса поверхностно-монтируемых интегральных микросхем.

Здесь микросхемы памяти, установленные на планку, имеют выводы типа BGA
Разрез печатной платы с корпусом типа BGA. Сверху видно кремниевый кристалл.

BGA произошёл от PGA. BGA выводы представляют собой шарики из припоя, нанесённые на контактные площадки с обратной стороны микросхемы. Микросхему располагают на печатной плате, согласно маркировке первого контакта на микросхеме и на плате. Затем микросхему нагревают с помощью паяльной станции или инфракрасного источника, так что шарики начинают плавиться. Поверхностное натяжение заставляет расплавленный припой зафиксировать микросхему ровно над тем местом, где она должна находиться на плате и не позволяет шарикам деформироваться.

Последняя технология произвела небольшой прорыв в индустрии, позволив на порядок увеличить плотность монтажа, улучшить теплопроводность, уменьшить наводки и самое главное обеспечить процесс изготовления. Развиваясь, данная технология рождала целую серию упаковок кристаллов для дальнейшего их монтажа на печатную плату.

Итак, мы подробно остановимся на упаковке FC-BGA.

FC-BGA(Flip Chip Ball Grid Array) - это BGA упаковка с открытым кристаллом, который припаян с использованием технологии Flip-Chip. Которая, в свою очередь, переводиться как многоуровневый компонент (компонент в компоненте) или "кристалл вверх ногами" в зависимости от её применения. Суть данной технологии в изменении контакта кристалла микросхемы с традиционной разводки прволокой на столбиковые контакты (делайте аналогию с BGA). То есть, по сути, мы получаем BGA в BGA: когда кристалл припаян к подложке, а подложка, в свою очередь, с помощью шариков будет монтироваться на печатную плату.

Теперь имея представление о конструкции упаковки чипа, уже можем сделать некоторые выводы о надежности, имея опыт пайки BGA соединений. Прекрасно зная и понимая, что надежность BGA соединения напрямую зависит от механических воздействий, вибрации, термального расширения и сужения, контакта с воздухом (взаимодействие с припоем, окисление контактов), разрушение структуры припоя под действие внешней среды и так далее. Смотря на структуру упаковки FC-BGA, мы понимаем, что наиболее уязвимым местом является соединение кристалла чипа с подложкой. Устранить данную проблему призван специальный наполнитель – компаунд, заполняемый всю область соединения.

Отработав технологии пайки BGA с применением свинцово-содержащего припоя производители добились довольно высоких результатов в плане надежности. Но...
Начиная с 1 июля 2006 г, директивами RoHS (Директивы RoHS и WEEE)Евросоюз запретил производителям использовать шесть опасных веществ (свинец, ртуть, кадмий, шестивалентный хром, PBB и PBDE). В дальнейшем в 2008 г директивы были ужесточены в плане использования еще целого ряда веществ. В результате отказа от свинца и применения альтернативных компонентов, пострадала надежность пайки и потребовала пересмотра всего технологического цикла производства и применяемых компонентов.

Теория закончена. Теперь рассмотрим процесс термального разрушения чипа.

Вследствие многократных запусков и остановок, микросхема постоянно подвергается термальному воздействию, то есть в зависимости от температурных перепадов, все компоненты микросхемы, начиная с кристалла (который является катализатором (первоисточником)), защитный компаунд, контактные площадки, слои подложки, межслоевые соединения, все начинают механические движения сужения и расширения (физическое воздействие температуры).
Остальные факторы, например разницы потенциалов, возможные электрические разряды или рост так называемых “оловянных усов” с применением Pb lead-free пайки, мы упускаем так как их воздействие незначительно, хотя и присутствует.

И так что мы получаем в результате: под термальным воздействием образуются микротрещины в компаунде, который призван защитить соединения. Кристалл и его контактные группы под воздействием механики (физика температуры) начинают постепенное расшатывание. Воздух, проникаемый через микротрещины в компаунде, начинает процесс окисления припоя в контактных группах, что в свою очередь только ускоряет потерю контакта. И в конце концов ЧИП «отваливается» от подложки.


Почему NVIDIA ?
Теперь разберем причины краха ЧИПов в столь большом количестве от компании NVIDIA.

Как мы знаем, сам кристалл тоже состоит из нескольких слоев и межслоевых соединений, но благодаря отлаженному процессу фотолитографии и технологическому процессу производства при правильном дизайне ЧИПа процент брака минимален, и отсеивается прямо на этапе производства перед упаковкой. Сам кристалл не слишком критичен к высоким рабочим температурам, а вот материалы упаковки в большой степени зависимы.
Вот это и была "ошибка" NVIDIA. После перехода на технологии без свинцовой пайки (с 2006 года) потребовалось менять состав материалов упаковки и перерасчета прочности соединения. Все дефектные чипы NVIDIA использовали технологии и упаковку корпорации TSMS (c наработками Fujitsu Microelectronics). В сумме с заниженным официальным термопакетом (TDP) и как следствие недостаточным теплоотводом, применяемым производителями, мы получаем быстрый выход ЧИПа из строя. Применяемый компаунд имеет недостаточный коэффициент теплового расширения, что приводит к потере защитных свойств компаунда, впрочем, как и сами материалы подложки не отвечали достаточному уровню надежности, как результат: «ОТВАЛ» кристалла от положки (разрушение самого тела контакта, либо повреждение контактных площадок).

Выводы.
Что происходит в момент диагностического нагрева ЧИПа? Почему чип временно восстанавливает работоспособность и почему не помогает re-ball?


Всем известная мера для диагностики выхода со строя микросхем в корпусе FC-BGA (в часности NVIDIA):
Кратковременный нагрев кристалла чипа воздухом с t = 150o-200o C (200o-300o C в зависимости от точности контроля температуры).
В процессе нагрева мы имеем резкое терморасширение кристалла с дальнейшей теплоотдачей на подложку. Контакты временно, механически восстанавливаються, а так как компаунд имеет заниженный коэффициент теплового расширения, относительно кристалла и подложки, в момент резкого нагрева и остывания он временно фиксирует установленное соединение. В результате мы получаем временно "оживший" ЧИП. Заметьте, нагрев происходит в области температуры, ниже температуры плавления припоя, поэтому контакты кристалла были восстановлены механически, и о никакой надежности и долговечности соединения не может быть речи. Поэтому это только ДИАГНОСТИЧЕСКАЯ МЕРА, по результатам которой можно сделать вывод о необходимой замены чипа.
Осмыслив теоретическую часть и поняв результаты диагностики («подуть») мы понимаем, что для полного восстановления работоспособности чипа необходимо произвести re-ball кристалла на подложку. Беря во внимание очень маленькие допуски и необходимость заполнения нового компаунда в область соединения, для ее защиты, данная процедура невозможна в ремонтных областях и нецелесообразна на производстве.

Прогрев, пропайка микросхем – метод, который не возможно отнести к ремонту. Это лишь диагностика BGA соединения подложки с печатной платой.
Прогрев NVIDIA – это лишь временное восстановление микросхемы, вызванное термо воздействием через подложку на контакты и сам кристалл. Даже доведя до плавления припоя под кристаллом, прогрев не решает проблем начавшегося разрушения контактных площадок кристалла и поврежденного компаунда. Результат – работает от недели до 1-2 месяцев, дальше возврат.
Re-ball – метод восстановления контактов подложки чипа с печатной платой. Применяется в результате механического повреждения контакта или начавшегося процесса окисления контактных площадок. Применяя реболл для псевдоремонта NVIDIA (и других FC-BGA), мы по сути делаем «извращенную» пропайку: в процессе поэтапного нагрева микросхемы снизу, сверху, и прохождения термопрофилей пайки, мы делаем намного интенсивное термо воздействие, уже на все компоненты микросхемы, которая на некоторых этапах, изолирована от теплоотвода платы. Результат - опять таки временное восстановление на достаточно короткое время, как правило не превышающее 1-2 месяцев.

Делая вывод из всего вышесказанного, уважаемые ремонтники, беря во внимание конструктивные особенности современных упаковок чипов (в часности FC-BGA) не стоит надеяться на качественный результат, применяя методы, призванные решать совсем не те проблемы. Если вам дорог результат, Вы не будете ремонтировать «отвал» кристалла в FC-BGA упаковке. Только замена на новый ЧИПдаст достойное Вас, как ремонтника, решение проблемы.



Иточники:


http://notebook1.ru
http://www.intel.com
http://www.nvidia.com
http://www.nvidia.ru
http://wikipedia.org
http://www.fujitsu.com