Проблемы и решения при настройке и работе GPU-ферм - Майнинг - CryptoTalk.Org Jump to content
scar313

Проблемы и решения при настройке и работе GPU-ферм

Recommended Posts

Решил создать тему, где все могут задать вопросы

по проблемам с настройкой , или проблемам в работе GPU-ригов

все равно в чате много майнеров, давайте помогать друг другу словом, или дельным советом.

 

Первый вопрос будет мой:

у меня есть риг на 7 видеокарт GTX1060 6G mining card

Материнка Gigabyte Z170-gaming K3

Операционка W10

Майнер Claymor 

Изначально копали ZEC, в далеком 2017-м. 

позже переключал разные алгоритмы, и пришел к тому что захотел поставить риг на ETH или ETC

И вылезла проблема:

после запуска работает минут 5-10, и слетают дрова видеокарт, разгон не влияет, даже на стоке все равно слетают. 

на днях пробовал поставить HiveOS, думал проблема в винде,  та же картина.

уже не знаю что думать.. 

есть второй риг, там все тоже самое , только материнка другая ( ASUS H270F Gaming)  , все работает мега-стабильно.. 

Карты все ставил на риг с 270-й материнкой все работает, то есть к картам вопросов нет.

неужели в материнке дело???  

на днях попробую переставить винду на другой релиз поменяю, отпишусь чо=то вышло из этого. 

 

Может есть у вас мысли куда копать, где проблему искать ??

 

  • Useful or interesting 2

 

468x60-19.jpg

Share this post


Link to post
Share on other sites

Драйвера какие ставил ? 

с сайта NVidia качал?   для этих карт слышал лучше драйвера с диска только ставить который в комплекте шел,

Пробовал снести драйвера и поставить заново? 

  • Useful or interesting 2

Share this post


Link to post
Share on other sites

Да, пробовал, сносил через DDU,   потом ставил снова с диска из комплекта... 

но у меня сложилось впечатление что DDU как то криво удалил.  поэтому и хочу все снести и заново поставить с чистого листа так сказать... 

главный вопрос, может быть в материнской плате какая-то проблема?

  • Useful or interesting 2

 

468x60-19.jpg

Share this post


Link to post
Share on other sites
3 hours ago, scar313 said:

Да, пробовал, сносил через DDU,   потом ставил снова с диска из комплекта... 

но у меня сложилось впечатление что DDU как то криво удалил.  поэтому и хочу все снести и заново поставить с чистого листа так сказать... 

главный вопрос, может быть в материнской плате какая-то проблема?

DDU криво удалить не может. Если дрова слетают через 5-10 минут, то почему бы не начать майнить с 1 карты (можно даже сразу в материнку прям)? И таким образом исключить проблемы с рейзерами и т.д. Какую ошибку пишет майнер? Как в HIVE OS в логах отображаются слетевшие драйвера?

И да, как небольшое дополнение для завсегдатаев, если не затруднит, то поставьте аватарки? Будем хоть друг друга узнавать.

Edited by Кукуруза
  • Useful or interesting 2

Share this post


Link to post
Share on other sites
4 hours ago, scar313 said:

на днях пробовал поставить HiveOS, думал проблема в винде,  та же картина.

Начинаем с того, что проблема уже не программная,

4 hours ago, scar313 said:

но у меня сложилось впечатление что DDU как то криво удалил

так как при смене ОС проблема остается. Для начала попробуйте вернуть карты полностью в исходное состояние. Полностью уберите разгон, уберите все карты кроме одной, прошейте биос матери до последней версии. Отпишитесь, если проблема сохранится, будем дальше думать.

Edited by Pyatka
  • Useful or interesting 1

Share this post


Link to post
Share on other sites
38 minutes ago, Pyatka said:

Для начала попробуйте вернуть карты полностью в исходное состояние - прошить оригинальный биос с оригинальными таймингами, если имели место такие манипуляции

карты не шились, все заводское

39 minutes ago, Pyatka said:

Полностью уберите разгон, уберите все карты кроме одной, прошейте биос матери до последней версии. Отпишитесь, если проблема сохранится, будем дальше думать.

ок, понял.. сделаю, отпишусь, 

но скорее всего только во вторник получится все это проделать..

хотя биос завтра проверю

  • Useful or interesting 1

 

468x60-19.jpg

Share this post


Link to post
Share on other sites
13 minutes ago, scar313 said:

карты не шились, все заводское

ок, понял.. сделаю, отпишусь, 

но скорее всего только во вторник получится все это проделать..

хотя биос завтра проверю

В 1066 никак биос проверить не получится, он там не изменяемый. На сток аналогично скинуть не выйдет, т.к. они и так без разгона в стоковом состоянии, только тестировать по 1 карточке пока. Это как один из вариантов. У кого какие еще идеи?

Share this post


Link to post
Share on other sites
54 minutes ago, Кукуруза said:

В 1066 никак биос проверить не получится, он там не изменяемый. На сток аналогично скинуть не выйдет, т.к. они и так без разгона в стоковом состоянии, только тестировать по 1 карточке пока. Это как один из вариантов. У кого какие еще идеи?

Раз господин @scar313 будет тестить только во вторник, то ещё сверху могу предположить влияние майнера на слёт драйверов. Маловероятно, но всяко нужно попробовать запустить сначала клеймор последней версии, потом феникс. Для полноты проверки можно даже старые версии потестить.

Share this post


Link to post
Share on other sites
8 hours ago, scar313 said:

главный вопрос, может быть в материнской плате какая-то проблема?

Нужно по одной карте добавлять в работу, удостоверившись, что установленные работают стабильно. Проблема может быть и в райзерах, и в разъемах PCIe, и в питании. Даже каждый экземпляр карты может вести себя иначе.

Поэтому я не стремлюсь засунуть кучу карт на один риг.

Share this post


Link to post
Share on other sites

Но тут проблема очень странная, на мой взгляд. Просто слетают драйвера.

14 hours ago, scar313 said:

карты не шились, все заводское

ок, понял.. сделаю, отпишусь, 

но скорее всего только во вторник получится все это проделать..

хотя биос завтра проверю

Кстати, а вот в какую-либо ошибку в диспетчере устройств карты слетают? Может там удастся что-то выцедить дополнительно по информации.

Share this post


Link to post
Share on other sites

Похоже на то что где-то плохой контакт. Прощупайте рукой все соединения проводов. Возможно выявите нагрев, тогда копать в ту сторону. У меня тоже так риг моросил, оказалось что подгорел разъём под питание цпу на материнке.


Лучшие курсы BTC-RUB всегда здесь

Share this post


Link to post
Share on other sites
22 hours ago, scar313 said:

Может есть у вас мысли куда копать, где проблему искать ??

 

Нескромный вопрос: оперативную память тестировали? Возможно от постоянного перегрева начала ошибками сыпать. Вполне поэтому могут быть проблемы.

Ну и само собой разумеется, раз риг давно уже работает, пора снять процессор и новую пасту положить: она со временем могла вся выгореть. В итоге процессор перегревается и срабатывает защита.

Share this post


Link to post
Share on other sites
16 hours ago, Bigpat said:

процессор перегревается и срабатывает защита.

Тогда просто выключался бы риг. А у человека отваливаются драйверы видеокарт. Нужно в первую очередь исключить программную составляющую. Переустановить винду/хайв, поставить самые новые драйвера. И если не поможет, то уже копать в сторону железа.


Лучшие курсы BTC-RUB всегда здесь

Share this post


Link to post
Share on other sites
On 21.10.2019 at 03:22, scar313 said:

скорее всего только во вторник получится все это проделать..

Дико извиняюсь... работы завал сегодня, не смог заняться своим ригом... 

Разгребусь немного и займусь... ведь надо выделить на это хотя бы часа три...четыре 

Так что не пропал никуда, разобраться обязательно надо,  напишу все как процесс пойдет

  • Useful or interesting 1

 

468x60-19.jpg

Share this post


Link to post
Share on other sites
On 20.10.2019 at 20:48, scar313 said:

Изначально копали ZEC, в далеком 2017-м. 

позже переключал разные алгоритмы, и пришел к тому что захотел поставить риг на ETH или ETC

И вылезла проблема:

То есть если я правильно понял в этой конфигурации ZEC копает нормально не копает Кефир и его производные одним словом алгоритм (дагер хашимото). Если это так тогда попробуйте вытащить из рига две карты оставьте пять карт и попробуйте если все пойдет отпишитесь будем думать что делать дальше. Вы не первый с этой мамкой вопросы решали люди вроде успешно.

Share this post


Link to post
Share on other sites
On 21.10.2019 at 19:26, Solo_miner said:

Похоже на то что где-то плохой контакт. Прощупайте рукой все соединения проводов. Возможно выявите нагрев, тогда копать в ту сторону. У меня тоже так риг моросил, оказалось что подгорел разъём под питание цпу на материнке.

Поддерживаю, тоже на такое натыкался. @scar313 у вас модульный блок питания? Могло банально питалово райзеров отваливаться опять же из-за перегрева или даже прогара, у самого так было

Share this post


Link to post
Share on other sites

Кстати, столкнулся со странным поведением некоторых карточек 1063 в майнинге Beam, что они периодически раз в сутки стали перезапускает майнер. И по итогу время работы майнера не совпадает с аптаймом системы. Никто не майнил Beam и не сталкивался с такой штукой? Майнер Gminer.

Share this post


Link to post
Share on other sites
On 21.10.2019 at 00:25, Кукуруза said:

проблемы с рейзерами

Скорее всего они и есть. У меня такие траблы когда то были - из-за одного райзера слетали дрова.

Метод один - метод "научного тыка" и исключения, тестить по одной карте на соем райзере, пока не найдешь глючный райзер.


photo_2023-02-05_15-22-32.jpg.17590a70fb6e6de5ac3e829229c3dc20.jpg

Share this post


Link to post
Share on other sites
36 minutes ago, Кукуруза said:

периодически раз в сутки стали перезапускает майнер

Нестабильность, перезапускается драйвер. Надо поднять напряжение или снизить частоты.

37 minutes ago, Кукуруза said:

некоторых карточек 1063

Надо начинать с самых некоторых.

Share this post


Link to post
Share on other sites
12 hours ago, Pyatka said:

Поддерживаю, тоже на такое натыкался. @scar313 у вас модульный блок питания? Могло банально питалово райзеров отваливаться опять же из-за перегрева или даже прогара, у самого так было

блок питания уже поменял, ситуация не изменилась.. 

13 hours ago, kitinc97 said:

То есть если я правильно понял в этой конфигурации ZEC копает нормально не копает Кефир и его производные одним словом алгоритм (дагер хашимото). Если это так тогда попробуйте вытащить из рига две карты оставьте пять карт и попробуйте если все пойдет отпишитесь будем думать что делать дальше. Вы не первый с этой мамкой вопросы решали люди вроде успешно.

Да, Eqiuhash во всех вариантах копает нормально... , а вот с эфиром не заходит. 

Интересно, а были именно проблемы при подключении более пяти карт??  


 

468x60-19.jpg

Share this post


Link to post
Share on other sites
2 hours ago, Кукуруза said:

Кстати, столкнулся со странным поведением некоторых карточек 1063 в майнинге Beam, что они периодически раз в сутки стали перезапускает майнер. И по итогу время работы майнера не совпадает с аптаймом системы. Никто не майнил Beam и не сталкивался с такой штукой? Майнер Gminer.

Наверняка у вас переразгон. Нужно почитать логи майнера в момент перезагрузки. А так, думаю перезапуск майнера раз в сутки ничего страшного за собой не несет.


Лучшие курсы BTC-RUB всегда здесь

Share this post


Link to post
Share on other sites
6 hours ago, Solo_miner said:

Наверняка у вас переразгон. Нужно почитать логи майнера в момент перезагрузки. А так, думаю перезапуск майнера раз в сутки ничего страшного за собой не несет.

Опровергну своим примером, когда копал на найсе - имел постоянные перезагрузки на одной из ферм, иногда даже пару раз в день. После каждой перезагрузки в афтербернере слетали настройки. Так и не понял в чём была проблема, с обновлением их платформы это ушло (или что-то я в настройках поменял)

Share this post


Link to post
Share on other sites
7 hours ago, Solo_miner said:

Наверняка у вас переразгон. Нужно почитать логи майнера в момент перезагрузки. А так, думаю перезапуск майнера раз в сутки ничего страшного за собой не несет.

Так  в том-то и дело, скидывал на сток и все равно майнер перезапускается стабильно. Очень странное поведение, вроде и все проверил и т.д. Надо будет еще покопать эту тему. Вроде и не прям критично, но какой-то перфекционист в душе подсказывает, что такого быть не должно. Вон красные сидят и спокойно себе аптайм делают неделями, пока я сам их не перезагружаю.

Share this post


Link to post
Share on other sites
10 hours ago, Кукуруза said:

Очень странное поведение, вроде и все проверил и т.д.

А если другой майнер использовать ? Не gminer, а к примеру cryptodredge, то тоже перезапуск происходит ? И вам не помешало бы прощупать все контакты на этом риге, возможно где-то плохой контакт.


Лучшие курсы BTC-RUB всегда здесь

Share this post


Link to post
Share on other sites
On 10/20/2019 at 10:48 PM, scar313 said:

неужели в материнке дело???

Здесь может быть что угодно. Начиная от программной части и заканчивая неисправностью любой комплектующей. Нужно проверять каждую железку отдельно на тестовом стенде.

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...